AN INITIATIVE BY
GFOSS GFOSS
GlossAPI

Δεδομένα για την ΤΝ

Αγωγός για την επεξεργασία κειμένων και τη μετατροπή τους σε έτοιμα προς χρήση σύνολα δεδομένων για εκπαίδευση Μεγάλων Γλωσσικών Μοντέλων.

Χρονολόγιο Δεδομένων

Παρακολούθηση της εξέλιξης των δεδομένων μας και της συνολικής πρόσληψης tokens

Όλα τα σύνολα δεδομένων διατίθενται με άδειες Creative Commons
ΙΟΥΝ 2026

new-sociology

14.5MB
6.1M Tokens
ΙΟΥΝ 2026

OpenCouncil

74.2MB
11.5M Tokens
ΙΟΥΝ 2026

enautilia v2

1.46MB
1.1M Tokens
ΙΟΥΝ 2026

artoszois v2

6.24MB
3.1M Tokens
ΙΟΥΝ 2026

heinrich_boell_stiftung

120KB
47.0K Tokens
ΙΟΥΝ 2026

psepheda

2.01GB
769.3M Tokens
ΙΟΥΝ 2026

libduth

1.4GB
716.6M Tokens
ΜΑΪ 2026

libiep

1.46GB
510.8M Tokens
ΜΑΪ 2026

greek-national-theatre-corpus

42.58MB
11.2M Tokens
ΜΑΪ 2026

elocus

1.34GB
568.7M Tokens
ΜΑΪ 2026

archetai

265.71MB
106.9M Tokens
ΑΠΡ 2026

eellak-articles

25.10MB
8.5M Tokens
ΑΠΡ 2026

opengov-deliberations-v2

357.71MB
111.4M Tokens
ΑΠΡ 2026

AMNA-press

1.48GB
158.2M Tokens
ΑΠΡ 2026

ERT Press

36.4MB
9.8M Tokens
ΜΑΡ 2026

Modern Greek Dictionary

33MB
4.9M Tokens
ΜΑΡ 2026

Istorima

416.02MB
138.9M Tokens
ΙΑΝ 2026

openbook.gr

251.63MB
133M Tokens
ΙΑΝ 2026

Greek PhD Theses Corpus

7.06GB
5.34B Tokens
ΙΟΥΝ 2025

eurlex-greek-legislation

2.21GB
604M Tokens
ΑΠΡ 2025

ellinika_dedomena_europaikou_koinovouliou

1.09GB
273M Tokens
ΑΠΡ 2025

Apothetirio_Kallipos

572MB
196M Tokens
ΜΑΡ 2025

Apothetirio_Pergamos

2.25GB
839M Tokens
ΙΑΝ 2025

1000_prwta_xronia_ellhnikhs

104MB
33M Tokens
ΙΑΝ 2025

Ekklisiastika_Keimena

16.7MB
6.5M Tokens
ΔΕΚ 2024

Wikisource_Greek_texts

116.3MB
38M Tokens
ΔΕΚ 2024

klasikh_arx_ell_grammateia

63.8MB
20.4M Tokens
ΔΕΚ 2024

Sxolika_vivlia

31.0MB
10.1M Tokens
ΝΟΕ 2024

Ellinika_Keimena_Project_Gutenberg

38.9MB
12.3M Tokens
ΝΟΕ 2024

95k_deigma_ellinikis

28.3MB
2.9M Tokens
ΝΟΕ 2024

dimodis_logotexnia

384KB
0.1M Tokens

Διάγραμμα Ανάπτυξης

Αθροιστικός Όγκος Tokens

10.650.929.548
ΣΥΝΟΛΟ TOKENS

Έχουμε μια ολόκληρη ομάδα αφοσιωμένη σε αυτό το έργο

Θέλεις να συνεργαστείς ή να συμμετέχεις; Αγαπάμε τις συνεργασίες και τους νέους συνεισφέροντες.