– Att sammanställa alla människans språk är mer brådskande än det var att kartlägga vår arvsmassa. När den siste talaren av ett språk dör dör också språket för gott. Varannan vecka går något språk förlorat, säger den australiske språkforskaren Steven Bird.
I samband med den internationella konferensen i datorlingvistik i Uppsala i veckan presenterade han det nya projektet – och uppmanade deltagarna att själva bidra till det.
– Meningen är att vem som helst som följer vissa regler ska kunna bidra och att uppgifterna ska vara fritt tillgängliga, både för språkforskare och för allmänheten i stort, säger Steven Bird.

Själv ska han bidra till denna gigantiska språkportal med exempel på många av de små, utrotningshotade språken på Papua Nya Guinea.
– Eftersom de saknar skriftspråk är enda sättet att få uppgifter om dessa språk är att göra ljudupptagningar med de människor som fortfarande talar dem, säger Steven Bird.
På Papua Nya Guinea arbetar ett stort antal studenter med detta. Ett hundratal elektroniska minidiktafoner, var och en med en kapacitet att lagra 50 timmars tal, delas ut till de (oftast äldre) personer ute i byarna som fortfarande kan tala något av de olika stamspråken.
– De är ofta fantastiska historieberättare. Oftast börjar de med att berätta sin egen historia, sedan stammens historia och till sist om sina sånger, medicinalväxter och annat. Sedan skriver studenterna ner och översätter ett urval av detta, säger Steven Bird.

Informationen, både muntlig och skriftlig, lagras i projektets databas. Med exempel från två talare av varje språk räcker de 100 diktafonerna till att kartlägga 50 av Papua Nya Guineas mer än 800 språk.
– Ett problem är att skriva ner vad de säger. Eftersom det saknas skriftspråk finns inga regler för hur orden stavas, säger Steven Bird.
Samtidigt som det nya projektet är en slags sista chans att bevara mycket av den språkliga mångfalden framhåller han att det är mycket mer än en sorts Noaks Ark för att rädda utrotningshotade språk.
– Ju mer information om språklig mångfald som finns tillgänglig, desto större är chanserna att ta reda på vad som är gemensamt för människans alla språk.
Om det är viktigt? Ja, språket brukar betecknas som det främsta kännetecknet för människans intelligens, säger Steven Bird.

För engelska, kinesiska, spanska, japanska, franska och flera andra stora språk finns redan en enorm mängd sökbara uppgifter på Internet. Men att många talar ett språk innebär inte automatiskt att det finns mycket information om det.
– Trots att hindi talas av hundratals miljoner människor skulle vi behöva många fler exempel på hur det språket används i tal och skrift, säger Steven Bird.
Från det att HUGO-projektet för att kartlägga människans arvsmassa drog igång dröjde det drygt tio år innan ett första utkast till en komplett kartläggning av hennes dna-spiral var klar. Det nya HLP-projektet – human language project – lär ta längre tid att fullborda.
– Var vi står om fem år? I dag har vi representativa data för bara omkring en halv procent av världens alla språk, om fem år tror jag att de finns för tio gånger fler språk. Och jag tror att vi då har automatiserade översättningsprogram för omkring 100 språk, dubbelt så många som i dag, säger Steven Bird.