12 april 2008

Het semantische web zit er aan te komen... not!

Naar aanleiding van een artikel op Frankwatching over Web 3.0 en het semantische web (link) heb ik daar de onderstaande reactie gepubliceerd, die ik nu ook even op mijn eigen blog zet - al was het maar om na een lange tijd van "afwezigheid" weer eens iets te schrijven...

Een tijdje terug had ik een discussie met mijn “neefje” Eduard (edwords) over het semantische web. Mijn insteek heeft te maken met mijn achtergrond: docent Engels en Informatica, en al zo’n 25 jaar geïnteresseerd in “machinevertalen”: met de computer een tekst vertalen. Als ik zie hoe traag dit zich ontwikkelt, denk ik dat het semantische web ook nog even wachten is.

De enige “redding” die ik zie, is: kennis van de wereld om ons heen gekoppeld aan het “ontleden” van tekst in context. Als ik zeg “Ik loop naar die bank”, en vlak daarvoor heb ik gezegd dat ik geld ga opnemen, kan software raden dat ik naar het gebouw van een financiële instelling (bank) loop. Als ik dezelfde zin gebruik en vlak daarvoor meld dat ik in een bos rondwandel, zou de conclusie kunnen zijn dat ik even wil gaan zitten op een bank.

Zelfs de huidige generatie vertaalsoftware (bijvoorbeeld Babelfish met Systran als engine) komt niet veel verder dan “woordjes ruilen”. Een mooi voorbeeld van een letterlijke vertaling kwam ik deze week bij een van mijn leerlingen tegen: “She is standing very strongly in her shoes”. Babelfish bakt er zelfs nog minder van: “She stands very strong in its shoes”.

Jaren geleden (in het DOS-tijdperk) had Symantec/Peter Norton (waar ik toen werkte) het produkt Q&A. In die software kon je in gewone mensentaal een vraag stellen om informatie uit de database op te halen. De software gooide dan gewoon de woorden die niet relevant waren weg, en hield dan bijvoorbeeld over “auto’s”, “onder 10.000 gulden” en “provincie Zuid-Holland”. Met die query ging ie op pad en meestal kwam er precies uit wat je wilde zien. Niet echt Artificial Intelligence, maar het werkte wel.

Zo lang vertaalsoftware niet de mogelijkheid heeft om een zin echt goed te analyseren èn die analyse te combineren met de context waarin die zin staat, denk ik dat we nog even zullen moeten wachten op het semantische web…

Geen opmerkingen: