door Liesbeth Koenen ©
06-08-1987
NRC Handelsblad

Intelligent maar met gebrek

Computers snappen nog steeds weinig van de praktijk van natuurlijke talen

Natuurlijke taal en kunstmatige intelligentie. G.A.M. Kempen. Wolters-Noordhoff, 1987. 166 blz. ISBN 90 01 46680 X

Praten met een machine die in gewone taal antwoord op de meest uiteenlopende vragen kan geven, die adviseert bij problemen en precies begrijpt wat je wil weten.

Vroeger sprak dat idee vooral tot de verbeelding van science fictionschrijvers en filmmakers, maar tegenwoordig werken wetenschappers daadwerkelijk aan de verwezenlijking van zulke apparaten. Maken ze ook een reële kans daarin te slagen?

Volgens professor Gerard Kempen wel. Onder de titel Natuurlijke taal en kunstmatige intelligentie heeft hij onlangs maar liefst vijftien pleidooien voor ‘kennistechnologie’, zoals hij het zelf noemt, verzameld. Het zijn allemaal lezingen en artikelen van hemzelf (soms samen met anderen) uit pakweg de afgelopen tien jaar. Het merendeel is al eens eerder gepubliceerd.

Kempen haalt in al die stukken heel wat interessante dingen overhoop. Dat valt ook te verwachten: zijn onderwerp is boeiend en bovendien bijzonder complex. De achterliggende gedachte bij dit soort onderzoek is tenslotte steeds dat we meer van onszelf gaan begrijpen als we een computer dingen proberen te leren die wij ook kunnen.

Maar ik denk dat een dergelijk onderwerp juist vanwege zijn ingewikkeldheid beter op een andere manier behandeld had kunnen worden. Wie iets uit wil leggen aan (achterflap:) ‘een breder, niet gespecialiseerd publiek van lezers die geïnteresseerd zijn in taalgedrag, computers en in de nieuwe informatiewetenschap’ moet nog veel meer vertellen en er een doorlopend verhaal van maken.

Nu lees ik in hoofdstuk acht dat Kempen een computerprogramma gemaakt heeft dat op ‘psychologisch en linguïstisch bevredigende’ wijze Nederlandse zinnen bouwt en ontleedt, en blijkt pas vier hoofdstukken later dat mijn verbaasde vraagtekens een grond hadden: de zinnenmaker is daar ineens ‘nog lang niet compleet’ en de zinsontleder ‘kwetsbaar’. Zowel argeloze als meer ingewijde lezers worden op die manier heel wat keren op het verkeerde been gezet.

Woordvolgorde

Want natuurlijk heeft ook Kempen het antwoord nog niet gevonden op alle vragen die bestaan over wat er nu precies in ons hoofd omgaat als we praten, luisteren, leren of begrijpen. Nog steeds is het vastleggen van de betekenissen van woorden iets dat hooguit ten dele lukt. Ook ‘kennis van de wereld’ is een machine maar fragmentarisch bij te brengen, terwijl die er nu net voortdurend voor zorgt dat mensen de goede interpretatie geven aan woorden en zinnen met meer dan een betekenis (‘Die vent droop met de staart tussen zijn benen af’ zal niemand letterljk nemen, omdat iedereen weet dat venten geen staarten hebben. Een computer moet je dat eerst vertellen).

Woordvolgorde blijft een ander struikelblok. Kempens ‘zinnenmaker’ heeft bijvoorbeeld moeite met de plaats van bijwoorden. Die mogen in het Nederlands bijna overal in de zin in verschijnen:

Nogmaals krabde Minous die bange hond met haar nageltjes.

Minous krabde nogmaals die bange hond met haar nageltjes.

Minous krabde die bange hond nogmaals met haar nageltjes.

Minous krabde die bange hond met haar nageltjes nogmaals.

Maar tussen het onderwerp en de persoonsvorm mag het net weer niet: ‘Minous nogmaals krabde die bange hond met haar nageltjes’ is fout. Een computer alleen al voor bijwoorden een grammaticale keuze te laten maken is niet eenvoudig, nog afgezien van het feit dat de positie van het bijwoord de precieze betekenis van de zin beïnvloedt.

Ik geloof overigens niet dat Kempen ons in zijn boek moedwillig misleidt. Het zijn zo te zien eerder zijn van enthousiasme overlopend gemoed en zijn geestdriftige verkooplust die hem de zaken her en der wat mooier voor doen stellen dan ze – in elk geval op dit moment nog – zijn.

Psychologie

Dat enthousiasme maakt ook iets goed van het gebrek aan diepgang en de herhalingen die Kempens artikelen vertonen. Hij weet overtuigend duidelijk te maken dat pogingen om de dingen die mensen kunnen in een machine te implementeren, veel kunnen vertellen over de inhoud en de structuur van wat die mensen doen.

Ook prototypen van dialoogsystemen (waarmee je in gewone mensentaal een vliegtuigvlucht kunt reserveren om een bekend voorbeeld te noemen) kunnen daarom al nuttig zijn. Het gaat weliswaar iedere keer om modellen, maar dat is in de wetenschap niet meer dan gebruikelijk. Zolang niemand vergeet dat computers anders werken dan hersenen (die laatste kunnen bijvoorbeeld wel van alles tegelijkertijd verwerken) geeft dat niet.

In Kempens eigen vak, de psychologie, is het bouwen van modellen en opstellen van fatsoenlijke theorieen nog veel te ongebruikelijk zegt hij zelf. Hij citeert in dit verband Roskam die zegt dat ‘psychologen veronderstellen dat mensen zich zus of zo gedragen omdat ze bepaalde trekken of disposities hebben, of omdat de situatie door hen op een bepaalde manier wordt opgevat.’ De experimentele psychologie observeert en meet en harkt zo allerlei factoren bij elkaar die van invloed zijn op menselijk gedrag.

Dat ‘ontbinden in factoren’ noemt Kempen de ‘analytische stijl van theorievorming’. Die bergt grote gevaren in zich. In Roskams woorden nogmaals: “In de achttiende eeuw werd het verbranden van stoffen ‘verklaard’ door aan te nemen dat brandbare stoffen een ‘brandstof’, phlogiston genaamd, bevatten, die bij verbranding vrijkomt. Onbrandbare stoffen zouden geen phlogiston bevatten… Het ‘bezitten’ van phlogiston als ‘oorzaak’ van verbranding doet denken aan het ‘bezitten’ van zwaarte als ‘oorzaak’ van vallen. In de psychologie is de voorstelling dat wij vermogens en behoeften bezitten hiermee vergelijkbaar.”

Het moet dus anders. Volgens Kempen zijn de technieken van de kunstmatige intelligentie het enige dat uitkomst kan bieden. Een computer immers kan veel en ingewikkelde gegevens snel verwerken en toetsen. Theorieën kunnen daarom veel vlugger gecontroleerd en vervolgens aangepast of uitgebreid worden.

Daar zit iets in, maar het neemt volgens mij nog niet weg dat je toch eerst een theorie moet hebben. Kempen schetst een model waarin observaties rechtstreeks de machine in gaan. Dat bestaat niet, en hij zal het ook wel niet letterlijk zo bedoelen, maar voor de duidelijkheid had hij hier (evenals op ontelbare andere plaatsen) explicieter moeten zijn. Ik moet er nu maar op gokken dat Kempen bedoelt dat psychologen anders moeten gaan werken en dat een computer ze kan helpen dat efficiënter te doen.

Maar zijn artikelen gaan niet alleen over zijn eigen vak. Het eerste deel van het boek is voor een groot deel gewijd aan de linguïstiek. ‘Taal’ vormt een belangrijk onderdeel van de artificiële intelligentie die uiteindelijk toch zoiets als ‘intelligent menselijk gedrag’ wil nabootsen. Kempen beperkt zich overigens tot het opstellen van een model voor hoe mensen zinnen bouwen en begrijpen, en gaat niet in op het verwerken of produceren van complete teksten. Dat is jammer. Verderop heeft hij het namelijk over computerprogramma’s die een samenvatting kunnen maken van stukken tekst die over een bepaald onderwerp handelen.

Graag had ik daar iets meer over gehoord, ook al werken die systemen lang niet perfect. Kempen geeft een voorbeeld van de automatische knipseldienst “wiens ‘intelligentie’ stoelde op kennis over natuurrampen, staatsiebezoeken, oorlogshandelingen enzovoorts. Toen er een telex binnenkwam over het overlijden van de paus en de schok die dit in de wereld teweeg had gevracht, vatte het systeem dit bericht samen met de woorden ‘aardbeving in Italie, 1 dode’.”

Een systeem als dit, zegt Kempen, is voorlopig niet meer dan een ‘idiot savant’: in een domein blinkt het uit, zaken daarbuiten worden krampachtig op dat ene domein betrokken of er wordt helemaal aan voorbij gezien.

Beetje vreemd

Kempens ideeën over hoe mensen zinnen maken lijken op het oog wel plausibel. Een beetje vreemd is alleen dat hij theoretisch taalkundigen verwijt dat hun modellen niet ‘psychologisch reëel’ zijn. Maar die theoretici onderzoeken alleen wat mensen weten en in principe kunnen (de competence), wat sprekers daar in de praktijk mee doen (hun performance) is nu juist het terrein van onderzoekers als Kempen zelf.

Inderdaad gooit iedereen wel eens halverwege de zin alsnog alles om en verspreken mensen zich. Kempen heeft dus gelijk als hij stelt dat we dikwijls niet vooraf een kant en klare zin construeren om hem daarna pas uit te spreken. De gedachte dat zoiets als “een team van syntactische experts, elk met een beperkt overzicht en met toegang tot slechts gespecialiseerde informatie over een type constituent” verantwoordelijk is voor de ‘zinsbouwactiviteit’ lijkt een aantrekkelijke verklaring te geven voor (sommige) versprekingen en ‘hervattingen’.

Tot slot brengt Kempen nog een stel grootse plannen en voorstellen waar geld voor moet komen. Niet alles lijkt me even haalbaar of handig. Zo stelt Kempen voor om de terminolgie uit de Algemene Nederlandse Spraakkunst (ANS) tot standaard te verheffen bij het maken van computerprogramma’s die het grammatica-onderwijs ondersteunen. Om daarvoor nu net een boek te nemen waarover aan alle kanten geklaagd wordt omdat de termen en definities die erin staan zo vaag, tegenstrijdig en zelfs fout zijn, lijkt me geen geslaagd idee.

Maar al met al zitten er wel zoveel interessante aspecten aan ‘kennistechnologie’ dat het terecht lijkt Kempen (en anderen) het voordeel van de twijfel te gunnen: dit soort onderzoek dient over voldoende fondsen te beschikken. Waarschijnlijk wordt de computer daarmee voorlopig niet meer dan een hulpje, maar wel een verdomd handig hulpje.