A képzés tematikája
A kvantitatív szövegelemzés és szövegbányászat alapfogalmai
Áttekintés a szövegbányászati módszerekről
Az R és R Studio használata
Adatimportálás, adatkezelés
A korpuszépítés problémái és a szövegelőkészítés
Leíró statisztika I: szózsák és szóeloszlások
Leíró statisztika II: A szövegek reprezentálása a vektortérben. A dokumentum-kifejezés mátrix. TF-IDF
Egyszerű szótár-alapú elemzések
Egyszerűbb mesterséges intelligenciára épülő elemzések
Bemeneti követelmény nincs, ugyanakkor az alapvető statisztikai, kvantitatív módszertani, valamint programozási ismerek hasznosak az anyag feldolgozásához.
A kurzushoz saját laptop szükséges, melyre az R és RStudio programok előzetesen telepítve vannak.
R program letöltése (legalább 4.0-ás verzió): https://www.r-project.org/
RStudio letöltése (legalább 1.4-es verzió):
https://www.rstudio.com/products/rstudio/download/#download
A kurzus során használt tankönyv:
Sebők Miklós - Ring Orsolya – Máté Ákos (szerk.): Szövegbányászat és mesterséges intelligencia R-ben – Egy társadalomtudományi bevezetés. Budapest, 2021.
A könyv elérhető az alábbi linken: https://tankonyv.poltextlab.com/
Felnőttképzéssel kapcsolatos tájékoztatás
A jelen képzés a felnőttképzésről szóló 2013. évi LXXVII. törvény szerinti, bejelentés alapján folytatott felnőttképzés.
Képzés megnevezése: Szövegbányászat AI-támogatással R-ben
Nyilvántartási szám: B/2025/001329
Időtartam (nettó): 4,5 óra (270 perc), 1 alkalom
Beosztás: 3 képzési blokk
Képzési nap: hamarosan…
Helyszín: Belvárosi oktatási helyszín (a regisztrált résztvevőknek e-mailben küldünk tájékoztatást)
Tanúsítvány: A Képzés vizsga nélkül zárul. A tanúsítvány kiadásának feltétele a Képzésen való részvétel, amely legalább a képzési órák 90%-ának teljesítésével igazolható, valamint a Résztvevő hozzájárulása ahhoz, hogy személyes adatait a Képző a Felnőttképzési Adatszolgáltatási Rendszer (FAR) részére továbbítsa.