Euskararen Erreferentzia Corpusa herritarren eskura jarri du. Corpusa, funtsean, testu bilduma handi bat da. Hizkuntza deskribatzeko eta ikertzeko baliatzen da, hizkuntza datuak eskaintzen baititu, lexikoari, morfosintaxiari eta semantikari dagokienak. Euskararen Erreferentzia Corpusaren aurkezpena martxo akaberan egin zen eta Andres Urrutia Badiola euskaltzain buruak esan zuenez, "Corpus orekatua, irekia eta kolektiboa da". Dagoeneko https://eec.euskaltzaindia.eus webgunearen bidez erabiltzaileen eskura dago.
Hainbat corpus mota daude, eta erreferentzia corpusa da horietako bat. Zehazki, hizkuntzaren erabilerari erreparatzen dio, "hizkuntza baten garai zehatz baten erakusgarri ahalik eta xeheena eta, aldi berean, zabalena" izateko sortua, Miriam Urkia Gonzalez euskaltzain osoak azaldu zuenez. Beraz, Euskararen Erreferentzia Corpusak euskararen egunean eguneko erabilerari begiratzen dio, eta, horregatik, beti bilduko ditu azken 25. urteetako datuak. Corpus "handiagoa eta orekatuagoa" da, eta hizkuntza teknologiek ekarri dituzten erronka berriei erantzuten die.
Argitaratu berri duten lehenengo bertsioak 23.124 dokumentu, 154,21 milioi testu hitz eta 129.817 lema biltzen ditu, lema, forma eta kategoria gramatikalen, zein gaia, euskalki edo erabilera erregistroaren araberako bilaketak egiteko moduan sailkatuak. Euskaltzaindiak adierazi duenez, corpusa sortzea "testu horien jabeak diren argitaletxe, erakunde eta komunikabideen eskuzabaltasuna gabe ezinezkoa litzateke." GUAIXEk, beste medio batzuekin batera, corpusa elikatzeko eduki digitalak eskaini dizkio Euskaltzaindiari.
Urteak daramatza Euskaltzaindiak hainbat corpus sortzen eta lantzen. 1980ko hamarkadan aurkeztu zituzten Orotariko Euskal Hiztegiaren corpusa eta XX. Mendeko Euskararen Corpus Estatistikoa. Lexikoaren Behatokia tresna ere jarri zuten abian geroago, eta horiei esker garatu ditzake Euskaltzaindiak, besteak beste, hiztegigintzako goi-mailako lanak.