europska unia

INFORMÁCIE O
PROJEKTE

Názov projektu: Falošné informácie v prostredí Internetu – identifikácia, analýza obsahu, emócie

Operačný program: Výskum a Inovácie

Výzva: OPVaI-VA/DP/2018/1.1.3-09

ITMS: ITMS 313011T527

Názov a sídlo prijímateľa: Univerzita Konštantína Filozofa v Nitre, Trieda Andreja Hlinku 1, 949 74 Nitra

Miesto realizácie: SR/Nitriansky kraj/Nitra

Žiadaná výška NFP: 662 339,47 €

Informácie o Operačnom programe Integrovaná infraštruktúra 2014-2020 nájdete na www.opii.gov.sk.

stručný
popis

Aktívne hľadanie prostriedkov, ktoré znemožnia falošným správam ovplyvňovať názory občanov je momentálne jednou z priorít Európskej komisie. Projekt je zameraný na návrh a implementácia postupov určených na identifikáciu falošných informácií publikovaných na Internete prostredníctvom metód pre pokročilé analýzy rozsiahlych dát. Cieľom projektu je vytvoriť verejne dostupnú webovú službu, ktorá dokáže v ľubovoľnej správe identifikovať charakteristiky typické pre falošné informácie.

V prípravnej fáze riešitelia vytvoria dataset článkov publikovaných v prostredí webu z rôznych oblastí. Zozbierané články budú ohodnotené reálnymi používateľmi z pohľadu pravdivosti. Následne bude navrhnutý model vyhodnocujúci správy z pohľadu rôznych charakteristík používaných pri analýze textov a prirodzeného jazyka. Na základe vypočítaných metrík (napr. analýza sentimentu, typické slová, vetná štruktúra, miera jazykovej náročnosti textu a pod.) bude možné správy kategorizovať a zoskupovať aj iným spôsobom ako pomocou podobnosti textu a nájsť tak metriky vhodné pre identifikáciu falošných správ.
Súčasťou projektu je i vyhodnocovanie emócií používateľa na základe snímania jeho biometrických funkcií (vzhľad tváre, tep, teplota a vodivosť kože a pod.) a hľadanie vzťahu medzi charakteristikami správy a emóciami, ktoré vyvolá.

projekt falsin

Prípravná fáza

Prípravná fáza sa orientuje na prípravu prostredia pre realizáciu projektu. Je rozdelená do troch podaktivít:

  1. Návrh a vytvorenie crawlera a vybudovanie datasetu – zabezpečí vytvorenie aplikácie zabezpečujúcej zber textových údajov (článkov) a ich uloženie vo forme vhodného datasetu.
  2. Návrh dátovej štruktúry pre indexovanie získaných správ a samotná indexácia – pre ukladanie datasetu je potrebné navrhnúť vhodnú dátovú štruktúru umožňujúcu rýchly prístup k textovým údajom a následné rýchle spracovanie. Spolu s vytvorením crawlera bude navrhnutý aj vhodný spôsob indexovania článkov.
  3. Príprava riešenia na zber fyziologických charakteristík používateľov a emócií – paralelne bude prebiehať návrh a overenie riešení pre zber údajov o biometrických funkciách používateľov.

Realizačná fáza

Realizačná fáza je rozdelená do štyroch podaktivít:

  1. Subjektívne hodnotenie správ v datasete – v rámci realizačnej fázy prebehne prvotné subjektívne hodnotenie článkov z datasetu používateľmi.
  2. Návrh metrík a algoritmov výpočtu pre získanie charakteristík správy – pokrýva definovanie postupov na extrakciu základných informácií o texte. Následným krokom bude experimentovanie s extrahovanými informáciami a extrahovanie plánovaných charakteristík ako napr. sentiment, „fake words“, zložitosť textu. Predpokladá sa tiež návrh nových charakteristík, ktoré však bude možné identifikovať až po úvodných experimentoch. Po identifikácii vybraných charakteristík bude potrebné štatistické overenie ich vhodnosti a napokon finálnou časťou bude vytvorenie modelu pre identifikáciu falošných správ.
  3. Vytvorenie nástroja pre zber emócií (hw+sw) kombináciou obrazu a údajov zo senzorov – bude vytváraný počas testovania modelu a zabezpečí zber a odosielanie získaných údajov.

 

Vytvorenie webovej služby na identifikáciu falošných informácií – nad overeným modelom bude následne vytvorená webová služba poskytujúca overenie pravdivosti/falošnosti článku. Webová služba ako aplikácia vytvoreného modelu (modelov) identifikácie falošných správ bola zvolená hlavne pre všeobecnosť a dostupnosť webových služieb. Takýmto spôsobom je možné ďalej rozširovať aplikačné možnosti identifikácie falošných správ do viacerých technológií.

novinky v informatike
projekt falsin

Záverečná fáza

Záverečná fáza pozostáva z dvoch podaktivít:

  1. Subjektívne hodnotenie správ v datasete (2. skupina) – prepája výstupy pre identifikáciu falošných správ a sledovanie emócií. Účastníkmi hodnotenia budú dobrovoľníci, u ktorých bude požiadavka na určovanie charakteristík správ, definovanie emócií, ktoré v nich správa vyvolala a súčasne bude daná emócia snímaná prostredníctvom navrhnutého riešenia. Na základe popisu emócie, zosnímania emócie a identifikácie správy bude vytvorený dataset použiteľný pre ďalší výskum.
  2. Overenie pravidiel pre identifikáciu emócií, ktoré daná trieda správ vyvolá – na základe výstupov zo subjektívneho hodnotenia správ používateľmi bude možné klasifikovať správy a priradiť k nim emócie ktoré vyvolávajú, čo možno využiť pri predikcii (a ovplyvňovaní) správania skupín čitateľov.

RIEŠITELIA PROJEKTU

ZOZNAM PODPORENÝCH publikácií

Tieto publikácie vznikli vďaka podpore v rámci Operačného programu Integrovaná infraštruktúra pre projekt: Falošné informácie v prostredí internetu – identifikácia, analýza obsahu, emócie s ITMS 313011T527, spolufinancovaný zo zdrojov Európskeho fondu regionálneho rozvoja.

  1. ADM Evaluating the Emotional State of a User Using a Webcam / Magdin Martin (80%) – Turčáni Milan (10%) – Hudec Lukáš (10%), 2016. DOI 10.9781/ijimai.2016.4112. In: INTERNATIONAL JOURNAL OF INTERACTIVE MULTIMEDIA AND ARTIFICIAL INTELLIGENCE. – ISSN 1989-1660, Vol. 4, no. 1 (2016), p. 61-68. zdroj: https://www.ijimai.org/journal/node/1228; pdf: https://www.ijimai.org/journal/node/1228
  2. AAB Metódy detekcie, extrakcie a klasifikácie emocionálneho stavu používateľa / Martin Magdin ; recenzent: Milan Turčáni, Kateřina Kostolányová. – 1. vyd. – Nitra : UKF, 2016. – 140 s. – ISBN 978-80-558-1020-1. zdroj ; pdf
  3. ADM Biometrics authentication of fingerprint with using fingerprint reader and microcontroller Arduino / Magdin Martin (45%) – Koprda Štefan (45%) – Ferenczy Ľubor (10%), 2018. DOI 10.12928/TELKOMNIKA.v16i2.7572. In: Telkomnika. – ISSN 1693-6930, Roč. 16, č. 2 (2018), s. 755-765. zdroj: http://journal.uad.ac.id/index.php/TELKOMNIKA/article/view/7572; pdf: http://journal.uad.ac.id/index.php/TELKOMNIKA/article/view/7572
  4. ADM Real Time Facial Expression Recognition Using Webcam and SDK Affectiva / Magdin Martin (90%) – Prikler Filip (10%), 2018. DOI 10.9781/ijimai.2017.11.002. In: International journal of interactive multimedia and artificial intelligence. – ISSN 1989-1660, Vol. 5, no. 1 (2018), p. 7-15. zdroj: https://www.ijimai.org/journal/node/1971; pdf: https://www.ijimai.org/journal/node/1971
  5. ADM Are Instructed Emotional States Suitable for Classification? Demonstration of How They Can Significantly Influence the Classification Result in An Automated Recognition System / Magdin Martin (99%) – Prikler Filip (1%), 2019. DOI 10.9781/ijimai.2018.03.002. In: International journal of interactive multimedia and artificial intelligence. – ISSN 1989-1660, Vol. 5, no. 4 (2019), p. 141-147. zdroj: https://www.ijimai.org/journal/node/2210; pdf: https://www.ijimai.org/journal/node/2210
  6. AFC An overview of solutions to the issue of exploring emotions using the internet of things / Francisti Jan (50%) – Balogh Zoltán (50%) 2019. DOI 10.1007/978-3-030-21507-1_9. In: Lecture Notes in Electrical Engineering, Springer : 3rd International Conference on Applied Physics, System Science and Computers, APSAC 2018, Dubrovník, 26. – 28.09.2018. – ISSN 1876-1100, P. 59-67. I. zdroj: https://link.springer.com/chapter/10.1007/978-3-030-21507-1_9; pdf: https://www.researchgate.net/publication/334079283_An_Overview_of_Solutions_to_the_Issue_of_Exploring_Emotions_Using_the_Internet_of_Things
  7. AFC Identification of Emotional States and Their Potential / Francisti Jan (50%) – Balogh Zoltán (50%).2019. DOI https://doi.org/10.1007/978-981-13-6861-5_58. In: Advances in Computer Communication and Computational Sciences : Advances in Intelligent Systems and Computing (AISC). Proceedings from The 3rd International Conference on Computer, Communication and Computational Sciences (IC4S 2018), Bangkok 20th-21st, October 2018 / Bhatia Sanjiv K. (ed). – Singapore : Springer, 2019. – ISSN 2194-5357, P. 687-696. zdroj: https://link.springer.com/chapter/10.1007/978-981-13-6861-5_58; pdf: https://www.researchgate.net/publication/333286061_Identification_of_Emotional_States_and_Their_Potential
  8. ADM A Case Study of Facial Emotion Classification Using Affdex / Magdin Martin (70%) – Benko Ľubomír (20%) – Koprda Štefan (10%), 2019. DOI 10.3390/s19092140. In: Sensors. – ISSN 1424-8220, Roč. 19, č. 9 (2019), s. 1-17. zdroj: https://www.mdpi.com/1424-8220/19/9/2140; pdf: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6539883/pdf/sensors-19-02140.pdf
  9. ADM Motion Detection and Face Recognition using Raspberry Pi, as a Part of, the Internet of Things / Balogh Zoltán (60%) – Magdin Martin (30%) – Molnár György (10%), 2019. DOI 10.12700/APH.16.3.2019.3.9. In: Acta Polytechnica Hungarica. – ISSN 1785-8860, Roč. 16, č. 3 (2019), s. 167-185. zdroj: https://www.uni-obuda.hu/journal/Issue90.htm; pdf: https://www.uni-obuda.hu/journal/Balogh_Magdin_Molnar_90.pdf
  10. AFC EmoSens – The Proposal of System for Recognition of Emotion with SDK Affectiva and Various Sensors / Magdin Martin (25%) – Kohútek Michal (25%) – Koprda Štefan (25%) – Balogh Zoltán (25%), 2019. DOI 10.1007/978-3-030-26763-6_39. In: Intelligent Computing Theories and Application : 15th International Conference, ICIC 2019, Nanchang, China, August 3–6, 2019, Proceedings, Part I ; De-Shuang Huang, Vitoantonio Bevilacqua. – ISBN 978-303026762-9. – ISSN 0302-9743, P. 400-411. I. zdroj: https://link.springer.com/chapter/10.1007/978-3-030-26763-6_39; pdf: https://www.researchgate.net/publication/334751778_EmoSens_-_The_Proposal_of_System_for_Recognition_of_Emotion_with_SDK_Affectiva_and_Various_Sensors
  11. ADC Voice Analysis Using PRAAT Software and Classification of User Emotional State / Magdin Martin (75%) – Sulka Timotej (5%) – Tomanová Júlia (10%) – Vozár Martin (10%), 2019. – DOI 10.9781/ijimai.2019.03.004. In: International Journal of Interactive Multimedia and Artificial Intelligence. – ISSN 1989-1660, Vol. 6, no. 5 (2019), p. 32-42. zdroj: https://www.ijimai.org/journal/node/2965; pdf: https://www.ijimai.org/journal/node/2965
  12. AFC Automatic Evaluation of MT Output and Post-edited MT Output for Genealogically Related Languages / Munková Daša (25%) – Munk Michal (25%) – Skalka Ján (25%) – Kasáš Karol (25%), 2020. DOI https://doi.org/10.1007/978-3-030-36778-7_46. In: Learning and Analytics in Intelligent Systems. Innovation in Information Systems and Technologies to Support Learning Research : EMENA-ISTL 2019. Proceedings of EMENA-ISTL 2019. 3. International Conference Europe Middle East & North Africa On Information System Technology and Learning Researches, November 21-23, 2019, Marrakech, Morocco. – Cham : Springer, 2020. – ISBN 978-3-030-36778-7, P. 416-425. zdroj: https://link.springer.com/chapter/10.1007/978-3-030-36778-7_46; pdf: https://www.researchgate.net/publication/337688850_Automatic_Evaluation_of_MT_Output_and_Post-edited_MT_Output_for_Genealogically_Related_Languages
  13. AFC Fake News Identification Based on Sentiment and Frequency Analysis / Jozef Kapusta, Ľubomír Benko, Michal Munk, 2020. DOI https://doi.org/10.1007/978-3-030-36778-7_44. In: Learning and Analytics in Intelligent Systems. Innovation in Information Systems and Technologies to Support Learning Research : EMENA-ISTL 2019. Proceedings of EMENA-ISTL 2019. 3. International Conference Europe Middle East & North Africa On Information System Technology and Learning Researches, November 21-23, 2019, Marrakech, Morocco. – Cham : Springer, 2020. – ISBN 978-3-030-36778-7, P. 400-409. zdroj: https://link.springer.com/chapter/10.1007/978-3-030-36778-7_44; pdf: https://www.researchgate.net/publication/337688506_Fake_News_Identification_Based_on_Sentiment_and_Frequency_Analysis
  14. AFD Improving student reading comprehension of learning materials using the analysis of Eye-Tracking data / Kohútek Michal (34%) – Turčáni Milan (33%) – Magdin Martin (33%), 2019. – In: Iceta 2019 : 17th IEEE International Conference on Emerging eLearning Technologies and Applications / František Jakab. – Starý Smokovec, The High Tatras, Slovakia : IEEE Czechoslovakia Section, 2019. – ISBN 978-1-7281-4966-0, s. 411-418. zdroj: https://www.researchgate.net/publication/339941961_Improving_student_reading_comprehension_of_learning_materials_using_the_analysis_of_Eye-Tracking_data; pdf: https://www.researchgate.net/publication/339941961_Improving_student_reading_comprehension_of_learning_materials_using_the_analysis_of_Eye-Tracking_data
  15. AFD Using the SDK Affdex for a Complex Recognition System Based on a Webcam / Magdin Martin (25%) – Benko Ľubomír (25%) – Kohútek Michal (25%) – Koprda Štefan (25%), 2019. – In: Iceta 2019 : 17th IEEE International Conference on Emerging eLearning Technologies and Applications, November 21 – 22, 2019 Starý Smokovec, The High Tatras, Slovakia. – Denver : IEEE, 2019. – ISBN 978-1-7281-4966-0, P. 499-504. zdroj: https://www.researchgate.net/publication/339941866_Using_the_SDK_Affdex_for_a_Complex_Recognition_System_Based_on_a_Webcam; pdf: https://www.researchgate.net/publication/339941866_Using_the_SDK_Affdex_for_a_Complex_Recognition_System_Based_on_a_Webcam
  16. AFC Comparison of fake and real news based on morphological analysis / Jozef Kapusta, Petr Hájek, Michal Munk, Ľubomír Benko. In: Procedia computer science, 3. International conference on Computing and Network Communications (CoCoNet’19), Trivandrum, Kerala, india, December 18-21, 2019 zdroj: Conference program: https://edas.info/p26389, List of accepteed papers: http://coconet-conference.org/2019/?q=accepted-papers; pdf: https://www.researchgate.net/publication/339826588_Comparison_of_fake_and_real_news_based_on_morphological_analysis
  17. AFC Evaluation of Machine Translation Quality through the Metrics of Error Rate and Accuracy / Dasa Munkova, Petr Hajek, Michal Munk, Jan Skalka. In: Procedia computer science, 3. International conference on Computing and Network Communications (CoCoNet’19), Trivandrum, Kerala, india, December 18-21, 2019 zdroj: Conference program: https://edas.info/p26389, List of accepteed papers: http://coconet-conference.org/2019/?q=accepted-papers; pdf: https://www.researchgate.net/publication/339816438_Evaluation_of_Machine_Translation_Quality_through_the_Metrics_of_Error_Rate_and_Accuracy
  18. AFC Web Usage Mining Data Pre-processing Impact on Found Knowledge in Predictive Modelling / Peter Svec, Lubomir Benko,  Miroslav Kadlecik,  Jan Kratochvil, Michal Munk. In: Procedia computer science, 3. International conference on Computing and Network Communications (CoCoNet’19), Trivandrum, Kerala, india, December 18-21, 2019 zdroj: Conference program: https://edas.info/p26389, List of accepteed papers: http://coconet-conference.org/2019/?q=accepted-papers; pdf: https://www.researchgate.net/publication/339816445_Third_International_Conference_on_Computing_and_Network_Communications_CoCoNet%2719
    _Web_Usage_Mining_Data_Pre-processing_Impact_on_Found_Knowledge_in_Predictive_Modelling
  19. ADM User Identification in the Process of Web Usage Data Preprocessing / Kapusta Jozef (25%) – Munk Michal (25%) – Halvoník Dominik (25%) – Drlík Martin (25%), 2019. DOI https://doi.org/10.3991/ijet.v14i09.9854. In: International Journal of Emerging Technologies in Learning. – ISSN 1868-8799, Roč. 14, č. 9 (2019), s. 21-33. I. zdroj: https://online-journals.org/index.php/i-jet/article/view/9854; pdf: https://online-journals.org/index.php/i-jet/article/view/9854/5662
  20. ADM Improvement of Misleading and Fake News Classification for Flective Languages by Morphological Group Analysis. / Kapusta, Jozef; Obonya, Juraj. 2020. In: Informatics 7, no. 1: 4. zdroj: https://www.mdpi.com/2227-9709/7/1/4; pdf: https://www.mdpi.com/2227-9709/7/1/4
  21. ADC Fake consumer review detection using deep neural networks integrating word embeddings and emotion mining. Hajek, P., Barushka, A., Munk, M., In: Neural Comput & Applic (2020). https://doi.org/10.1007/s00521-020-04757-2 zdroj: https://link.springer.com/article/10.1007%2Fs00521-020-04757-2#article-info; pdf: