Het maakt niet uit of er afkortingen in je sms'jes staan, pikante taal of dialect, Belgische wetenschappers van de Hogeschool Gent en de KULeuven zouden dolgraag uw sms'en willen hebben. De onderzoekers hebben al een mega-verzameling geschreven woorden, 500 miljoen stuks om precies te zijn, die ze overal vandaan gehaald hebben.
Volgens Veronique Hoste van de Hogeschool Gent zijn rechtbankverslagen, boeken, tijdschriften, handleidingen kranten en wat al niet meer doorgespit om de verzameling continue up-to-date te houden. Tegenwoordig wordt ook op websites, social media en sms'en gezocht naar bruikbare teksten.
En net bij de sms'jes hebben de wetenschappers uw hulp nodig. Teksten van websites kunnen ze zelf verzamelen alleen voor de sms'en hebben ze de hulp van de schrijvers nodig. Die hoeven zich overigens geen druk te maken over hun privacy want de sms'en worden geanonimiseerd en op een grote hoop gegooid.
Met deze berg aan tekstberichten worden modellen opgesteld voor technologische toepassingen. Je moet dan bijvoorbeeld denken aan spraakcomputers die sms'en om kunnen zetten naar begrijpbare spreektaal. Door alle afkortingen en dialecten die er momenteel gebruikt worden is het niet veel soeps wat er nu uit de stemcomputers komt.
De onderzoekers hopen tegen eind november het streefaantal van 200.000 sms'en bij elkaar te hebben.
