{"id":42574,"date":"2024-10-04T15:56:36","date_gmt":"2024-10-04T08:56:36","guid":{"rendered":"https:\/\/digi-texx.com\/case-studies\/datenannotation-und-kennzeichnung-von-social-media-daten-zur-pandemievorhersage\/"},"modified":"2026-05-20T16:55:52","modified_gmt":"2026-05-20T09:55:52","slug":"datenannotation-und-kennzeichnung-von-social-media-daten-zur-pandemievorhersage","status":"publish","type":"case-studies","link":"https:\/\/digi-texx.com\/de\/case-studies\/datenannotation-und-kennzeichnung-von-social-media-daten-zur-pandemievorhersage\/","title":{"rendered":"Datenannotation und Kennzeichnung von Social-Media-Daten zur Pandemievorhersage"},"content":{"rendered":"<div class=\"gb-container gb-container-049d4be1\"><div class=\"gb-inside-container\">\n\n<h2 class=\"gb-headline gb-headline-9ac0d6d3 gb-headline-text\"><span class=\"ez-toc-section\" id=\"Geschaeftliche_Herausforderungen\"><\/span>Gesch\u00e4ftliche Herausforderungen<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<h3 class=\"gb-headline gb-headline-2e78daf4 gb-headline-text\"><span class=\"ez-toc-section\" id=\"Unser_Kunde\"><\/span><strong><strong><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\"><strong>Unser Kunde<\/strong><\/span><\/strong><\/strong><\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Der Kunde von DIGI-TEXX ist ein Experte einer der f\u00fchrenden Forschungsuniversit\u00e4ten im Herzen von Tokio, Japan. Mit einer Spezialisierung auf Umweltgesundheit und Geoinformatik f\u00fchrt der Kunde verschiedene Forschungsprojekte zu den Auswirkungen von Umweltver\u00e4nderungen auf den Menschen unter Einsatz von maschinellem Lernen und NLP durch. <\/p>\n\n\n\n<p>Der Kunde hat die Anwendung von maschinellem Lernen auf Daten zu krankheitsbezogenen Themen in sozialen Medien erforscht, die f\u00fcr die Vorhersage von Pandemiewellen genutzt werden k\u00f6nnen.<\/p>\n\n\n<style>.kb-image23566_f519d9-68 .kb-image-has-overlay:after{opacity:0.3;}<\/style>\n<div class=\"wp-block-kadence-image kb-image23566_f519d9-68\"><figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"740\" height=\"416\" src=\"https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Data-Annotation-and-Labeling-Social-Media-Data-To-Predict-The-Pandemic_Thumbnail.jpg\" alt=\"Data Annotation and Labeling Social Media Data To Predict The Pandemic_Thumbnail\" class=\"kb-img wp-image-23588\" title=\"\" srcset=\"https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Data-Annotation-and-Labeling-Social-Media-Data-To-Predict-The-Pandemic_Thumbnail.jpg 740w, https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Data-Annotation-and-Labeling-Social-Media-Data-To-Predict-The-Pandemic_Thumbnail-300x169.jpg 300w\" sizes=\"auto, (max-width: 740px) 100vw, 740px\" \/><\/figure><\/div>\n\n\n\n<h3 class=\"gb-headline gb-headline-fe55f590 gb-headline-text\"><span class=\"ez-toc-section\" id=\"Herausforderungen_des_Projekts\"><\/span><strong><strong><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\"><strong>Herausforderungen des Projekts<\/strong><\/span><\/strong><\/strong><\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong><em><strong><em><span style=\"color: var(--accent);\" class=\"stk-highlight\">Erkenntnisreiche Daten verbergen sich in t\u00e4glichen Social-Media-Beitr\u00e4gen <\/span><\/em><\/strong><\/em><\/strong><\/p>\n\n\n\n<p>Angesichts der aktuellen Bedrohung der globalen Gesundheit durch COVID-19 sind Social-Media-Daten in den Fokus der Forscher ger\u00fcckt. Insbesondere <a href=\"https:\/\/twitter.com\/\" target=\"_blank\" rel=\"noopener\"><strong>X<\/strong><\/a> bietet vielf\u00e4ltige M\u00f6glichkeiten, um unterschiedliche Facetten bei der Vorhersage potenzieller Krankheitsausbreitungen zu untersuchen. <\/p>\n\n\n<style>.kb-image23566_e1a2b6-de .kb-image-has-overlay:after{opacity:0.3;}<\/style>\n<div class=\"wp-block-kadence-image kb-image23566_e1a2b6-de\"><figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"740\" height=\"416\" src=\"https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Data-Annotation-and-Labeling-Social-Media-Data-To-Predict-The-Pandemic-2.jpg\" alt=\"Data Annotation and Labeling Social Media Data To Predict The Pandemic 2\" class=\"kb-img wp-image-23575\" title=\"\" srcset=\"https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Data-Annotation-and-Labeling-Social-Media-Data-To-Predict-The-Pandemic-2.jpg 740w, https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Data-Annotation-and-Labeling-Social-Media-Data-To-Predict-The-Pandemic-2-300x169.jpg 300w\" sizes=\"auto, (max-width: 740px) 100vw, 740px\" \/><\/figure><\/div>\n\n\n\n<p>Laut der<a href=\"https:\/\/www.ncbi.nlm.nih.gov\/pmc\/articles\/PMC7906737\/\" target=\"_blank\" rel=\"noopener\"> National Library of Medicine<\/a>, haben zahlreiche Studien durch die Erfassung von Suchindizes in sozialen Medien zu COVID-19-Symptomen gezeigt, dass neue Verdachtsf\u00e4lle bereits 6\u20139 Tage oder sogar 1\u20132 Wochen fr\u00fcher vorhergesagt werden k\u00f6nnen als in offiziellen Aufzeichnungen. <\/p>\n\n\n\n<p>Eine weitere Studie im <a href=\"https:\/\/www.ncbi.nlm.nih.gov\/pmc\/articles\/PMC8085269\/pdf\/fpubh-09-656635.pdf\" target=\"_blank\" rel=\"noopener\">Frontiers in Public Health Journal<\/a> aus dem Jahr 2021 untersuchte digitale Datenstr\u00f6me als Fr\u00fchwarnsignale f\u00fcr COVID-19-Ausbr\u00fcche in Kanada und den USA. Dabei wurde festgestellt, dass symptombezogene Posts auf X (Twitter) die beste Prognoseleistung erbrachten, indem 100% der ersten Wellen etwa 2\u20136 Tage fr\u00fcher als durch andere Datenstr\u00f6me vorhergesagt wurden. <\/p>\n\n\n\n<p>Trotz der potenziellen Vorteile sozialer Medien f\u00fcr die Forschung sah sich unser Kunde mit mehreren H\u00fcrden konfrontiert. Das hohe Datenvolumen, das pr\u00e4zise annotiert werden muss, stellt in Verbindung mit engen Fristen eine erhebliche Herausforderung dar. <\/p>\n\n\n\n<p>Zudem weisen die Daten der Zielplattform \u2013 <a href=\"https:\/\/twitter.com\/\" target=\"_blank\" rel=\"noopener\"><strong>X<\/strong><\/a> (Twitter) \u2013 in der Regel kurze Texte und h\u00e4ufig Abk\u00fcrzungen, Hashtags usw., was das Verst\u00e4ndnis der Kontextinformationen erschwert.<\/p>\n\n\n\n<h3 class=\"gb-headline gb-headline-25fbbbd3 gb-headline-text\"><span class=\"ez-toc-section\" id=\"Projektumfang\"><\/span><strong><strong><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\">Projektumfang<\/span><\/strong><\/strong><\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Klassifizierung, Kennzeichnung und Kategorisierung von Nutzer-Tweets auf <strong><a href=\"https:\/\/twitter.com\/\" target=\"_blank\" rel=\"noopener\">X<\/a> <\/strong>(Twitter) basierend auf vordefinierten Kriterien: Schl\u00fcsselw\u00f6rter, Phrasen und Stimmungen im Zusammenhang mit grippe\u00e4hnlichen Symptomen. <\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Datenvolumen: <\/strong>Die betr\u00e4chtliche Datenmenge des Kunden, einschlie\u00dflich 200.000 Tweets, muss innerhalb von 2 Monaten annotiert werden.<\/li>\n\n\n\n<li><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\">Sprache<\/span>:<\/strong> Kenntnisse in Englisch und Chinesisch sind erforderlich.<\/li>\n\n\n\n<li><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\">Ethische Erw\u00e4gungen<\/span>:<\/strong> Einhaltung von Datenschutzbestimmungen und ethischen Richtlinien. <\/li>\n\n\n\n<li><strong>Betriebszeit<\/strong>: 24\/7<\/li>\n<\/ul>\n\n<\/div><\/div><div class=\"gb-container gb-container-540b5898\"><div class=\"gb-inside-container\">\n\n<h2 class=\"gb-headline gb-headline-c2b72c8c gb-headline-text\"><span class=\"ez-toc-section\" id=\"Loesung\"><\/span><strong><strong>L\u00f6sung<\/strong><\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<h3 class=\"gb-headline gb-headline-91203dbc gb-headline-text\"><span class=\"ez-toc-section\" id=\"Textannotation_mit_Natural_Language_Processing\"><\/span><strong><strong><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\"><span style=\"color: var(--accent);\" class=\"stk-highlight\"><strong>Textannotation mit Natural Language Processing<\/strong><\/span><\/span><\/strong><\/strong><\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>DIGI-TEXX lieferte einen hybriden <a href=\"https:\/\/digi-texx.com\/data-management\/data-annotation-services\/\"><strong>Textannotationsservice <\/strong><\/a>mit Human-in-the-Loop, der die Leistungsf\u00e4higkeit von maschinellem Lernen, Natural Language Processing (NLP) und einem Team hochqualifizierter Datenannotiertoren mit fortgeschrittenen Englisch- und Chinesischkenntnissen kombinierte. Dieser Ansatz optimierte die Ergebnisse f\u00fcr das Projekt und gew\u00e4hrleistete eine effiziente Annotation des gro\u00dfen Datensatzes. <\/p>\n\n\n\n<p><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\">Text annotation process<\/span><\/strong>:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><span style=\"color: var(--accent);\" class=\"stk-highlight\"><strong>Data Pre-processing:<\/strong> <\/span> Classify relevant categories and remove irrelevant data, duplicates, and noisy content.<\/li>\n\n\n\n<li><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\">Schl\u00fcsselwort- und Stimmungsanalyse:<\/span><\/strong> Einsatz von NLP-Techniken zur Analyse und Identifizierung relevanter Schl\u00fcsselw\u00f6rter und Phrasen im Zusammenhang mit grippe\u00e4hnlichen Symptomen. Nutzung von Modellen des maschinellen Lernens zur Ermittlung der Stimmung, die mit den extrahierten Schl\u00fcsselw\u00f6rtern und Phrasen verbunden ist. <\/li>\n\n\n\n<li><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\">Daten-Labeling:<\/span> <\/strong>Kennzeichnen Sie einen Teil der Daten mit relevanten Kategorien: \u201ehohe Infektionswahrscheinlichkeit\u201c und \u201egeringe Wahrscheinlichkeit oder unzureichende Informationen\u201c, um pr\u00e4zise und effiziente Daten f\u00fcr kundenspezifische Anforderungen bereitzustellen. <\/li>\n\n\n\n<li><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\">Qualit\u00e4tssicherung:<\/span><\/strong> Unsere Annotatoren f\u00fchrten regelm\u00e4\u00dfige Qualit\u00e4tssicherungsma\u00dfnahmen durch, um die Genauigkeit und Konsistenz des Projekts zu \u00fcberwachen. Dar\u00fcber hinaus wurde ein Feedback-Kreislauf eingerichtet, um die Leistung kontinuierlich zu bewerten und zu verbessern. <\/li>\n\n\n\n<li><strong><span style=\"color: var(--accent);\" class=\"stk-highlight\">Datenexport und -bereitstellung:<\/span> <\/strong>Lieferung des annotierten Datensatzes, der mit den Systemen des Kunden f\u00fcr weitere Analysen und Forschungsarbeiten kompatibel ist.<\/li>\n<\/ol>\n\n\n<style>.kb-image23566_60d73f-52 .kb-image-has-overlay:after{opacity:0.3;}<\/style>\n<div class=\"wp-block-kadence-image kb-image23566_60d73f-52\"><figure class=\"aligncenter\"><img loading=\"lazy\" decoding=\"async\" width=\"740\" height=\"416\" src=\"https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Text-Annotation-With-Natural-Language-Processing-Process.jpg\" alt=\"Textannotation mit Natural Language Processing\" class=\"kb-img wp-image-23567\" title=\"\" srcset=\"https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Text-Annotation-With-Natural-Language-Processing-Process.jpg 740w, https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Text-Annotation-With-Natural-Language-Processing-Process-300x169.jpg 300w\" sizes=\"auto, (max-width: 740px) 100vw, 740px\" \/><\/figure><\/div>\n\n<\/div><\/div><div class=\"gb-container gb-container-3c64cdaf\"><div class=\"gb-inside-container\">\n<div class=\"gb-grid-wrapper gb-grid-wrapper-84dc8722\">\n<div class=\"gb-grid-column gb-grid-column-31652cd0\"><div class=\"gb-container gb-container-31652cd0\"><div class=\"gb-inside-container\">\n\n<h2 class=\"gb-headline gb-headline-6c0964bb gb-headline-text\"><span class=\"ez-toc-section\" id=\"GESCHAeFTSERGEBNIS\"><\/span>GESCH\u00c4FTSERGEBNIS<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Pr\u00e4zise Annotation von <strong><span style=\"color: var(--accent);\" class=\"stk-highlight\">200.000 Chinese posts<\/span><\/strong> von <a href=\"https:\/\/twitter.com\/\" target=\"_blank\" rel=\"noopener\"><strong>X<\/strong><\/a> Plattformen.<\/li>\n\n\n\n<li>Abschluss des Projekts innerhalb von<span style=\"color: var(--accent);\" class=\"stk-highlight\"> 2 Monaten<\/span>.<\/li>\n\n\n\n<li>Genauigkeitsrate: <span style=\"color: var(--accent);\" class=\"stk-highlight\"><strong>100%<\/strong><\/span><\/li>\n\n\n\n<li>Bereitstellung qualitativ hochwertiger annotierter Daten zur Steigerung der Genauigkeit und Effizienz des KI-Algorithmus des Kunden.<\/li>\n\n\n\n<li>Die annotierten Daten k\u00f6nnen zur Entwicklung pr\u00e4ziserer und zeitnaher Fr\u00fchwarnsysteme f\u00fcr k\u00fcnftige Pandemien genutzt werden, was proaktive Ma\u00dfnahmen erm\u00f6glicht.<\/li>\n<\/ul>\n\n<\/div><\/div><\/div>\n\n<div class=\"gb-grid-column gb-grid-column-0123e88f\"><div class=\"gb-container gb-container-0123e88f\"><div class=\"gb-inside-container\">\n\n<figure class=\"gb-block-image gb-block-image-d804f78c\"><img loading=\"lazy\" decoding=\"async\" width=\"740\" height=\"416\" class=\"gb-image gb-image-d804f78c\" src=\"https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Data-Annotation-and-Labeling-Social-Media-Data-To-Predict-The-Pandemic-3.jpg\" alt=\"Datenannotation und Kennzeichnung von Social-Media-Daten zur Pandemievorhersage\" title=\"Datenannotation und Kennzeichnung von Social-Media-Daten zur Pandemievorhersage\" srcset=\"https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Data-Annotation-and-Labeling-Social-Media-Data-To-Predict-The-Pandemic-3.jpg 740w, https:\/\/digi-texx.com\/wp-content\/uploads\/2024\/10\/Data-Annotation-and-Labeling-Social-Media-Data-To-Predict-The-Pandemic-3-300x169.jpg 300w\" sizes=\"auto, (max-width: 740px) 100vw, 740px\" \/><\/figure>\n\n<\/div><\/div><\/div>\n<\/div>\n<\/div><\/div>","protected":false},"excerpt":{"rendered":"<p>DIGI-TEXX lieferte einen hybriden Textannotationsservice mit Human-in-the-Loop, der die Leistungsf\u00e4higkeit von maschinellem Lernen, Natural Language Processing (NLP)&#8230;<\/p>\n","protected":false},"featured_media":42579,"template":"","industries":[205],"class_list":["post-42574","case-studies","type-case-studies","status-publish","has-post-thumbnail","hentry","industries-bildungswesen"],"acf":[],"_links":{"self":[{"href":"https:\/\/digi-texx.com\/de\/wp-json\/wp\/v2\/case-studies\/42574","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/digi-texx.com\/de\/wp-json\/wp\/v2\/case-studies"}],"about":[{"href":"https:\/\/digi-texx.com\/de\/wp-json\/wp\/v2\/types\/case-studies"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/digi-texx.com\/de\/wp-json\/wp\/v2\/media\/42579"}],"wp:attachment":[{"href":"https:\/\/digi-texx.com\/de\/wp-json\/wp\/v2\/media?parent=42574"}],"wp:term":[{"taxonomy":"industries","embeddable":true,"href":"https:\/\/digi-texx.com\/de\/wp-json\/wp\/v2\/industries?post=42574"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}