EuroLLM
EuroLLM yhteiseurooppalainen, Euroopan unionin rahoittama tutkimus- ja kehityshanke ajanmukaisten, avoimien laajojen kielimallien (LLM) kehittämiseksi kaikille Euroopan unionin kielille.[1][2][3][4][5] Kestoltaan hanke on lyhyt: vain vuoden (1. toukokuuta 2024–30.huhtikuuta 2025).[6] Hankkeen eräänä tarkoituksena on luoda monikielinen kehys luonnollisen kielen käsittelyn (NLP) tutkimukselle Euroopassa.
Hankkeessa on mukana monia yliopistoja ja tutkimuslaitoksia Euroopasta. Tutkimushankkeeseen osallistuvat esimerkiksi Edinburghin yliopisto, Lissabonin yliopiston teknillinen korkeakoulu ja Sorbonnen yliopisto.[6]
EuroLLM-yhteenliittymä kertoo kotisivullaan hankkeen tavoittelevan kielimallien julkaisemista kolmessa kokoluokassa (1B, 9B ja 22B) 4T tokenilla.[6][a] Julkaistuja kielimalleja ovat (1/2025 mennessä):[7][8][9]
- EuroLLM-1.7B
- LLM-1.7B-Instruct
- EuroLLM-9B
- EuroLLM-9B-Instruct
Mallin versiot 1.7B ja 9B on julkaistu 35 kielellä, jossa ovat mukana Euroopan unionin 24 virallista kieltä ja 11 muuta kieltä.[5][9] EU-kielten ohella hankkeeseen valittuja kaupallisesti ja strategisesti tärkeitä kieliä olivat arabia, hindi, japani, kiina, korea, norja, turkki, venäjä, ukraina sekä kaksi Espanjan kansallista kieltä (katalaani ja galicia).[9][10][1] Hankkeen vahvuus eurooppalaisissa kielissä johtuu osittain EuroLLM-9B mallin sanoja osiinsa jaottelevavasta tokenizer-ohjelmistosta, joka on rakennettu 128 000 luonnollisen kielen sanan sanastolle. Mallia on koulutettu Barcelonan supertietokonekeskuksen Mare Nostrum 5-supertietokoneen avulla.[5]
Katso myös
[muokkaa | muokkaa wikitekstiä]Huomautukset
[muokkaa | muokkaa wikitekstiä]- ↑ Hankkeen kotisivusta poikkeavasti eurooppalainen EuroHPC, joka koordinoi Euroopan unionin supertietokoneresursseja (myös EuroLLM-hankkeeseen osallistuvaa Barcelonan laskentakeskuksen Mare Nostrum 5:sta), esittää projektiaikana tähdättävän kielimallien julkaisemiseen neljässä eri kokoluokassa (7B, 30B, 65B ja 200B).[4]
Lähteet
[muokkaa | muokkaa wikitekstiä]- ↑ a b Pedro Henrique Martins, Patrick Fernandes, Joao Alves, et al.: EuroLLM: Multilingual Language Models for Europe (artikkeliluonnos) arxiv.org. 24.9.2024. Viitattu 5.2.2025. (englanniksi)
- ↑ Maria Stasimioti: The First Large Language Model Supporting All EU Languages Is Here (konekäännös englanniksi) slator.com. 27.9.2024. Viitattu 5.2.2025. (englanniksi)
- ↑ Maygane Janin: EuroLLM: Pioneering European Open Source AI europa.eu. 11.10.2024. Viitattu 5.2.2025. (englanniksi)
- ↑ a b EuroLLM The European High Performance Computing Joint Undertaking (EuroHPC JU), eurohpc-ju.europa.eu. Viitattu 5.2.2025. (englanniksi)
- ↑ a b c Sergio De Simone: EuroLLM-9B Aims to Improve State of the Art LLM Support for European Languages infoq.com. 27.12.2024. Viitattu 5.2.2025. (englanniksi)
- ↑ a b c EuroLLM: Open Source European Large Language Model (Project home page) EuroLLM via sites.google.com. Viitattu 5.2.2025. (englanniksi)
- ↑ EuroLLM Hugging Face, huggingface.co. 2.12.2024 (päivitetty). Viitattu 5.2.2025. (englanniksi)
- ↑ Model Card for EuroLLM-1.7B Hugging Face, huggingface.co. 2.12.2024 (päivitetty). Viitattu 5.2.2025. (englanniksi)
- ↑ a b c Pedro Henrique, Martins João Alves, Patrick Fernandes, Nuno Guerreiro & Ricardo Costa Dias Rei: EuroLLM-9B (EuroLLM-tiimin blogi) Hugging Face, huggingface.co. 2.12.2024. Viitattu 5.2.2025. (englanniksi)
- ↑ Model Card for EuroLLM-9B Hugging Face, huggingface.co. 2.12.2024 (päivitetty). Viitattu 5.2.2025. (englanniksi)