Oxford English Corpus

Iris Sprenger April 7, 2016 O 0 0
FONT SIZE:
fontsize_dec
fontsize_inc

Das Oxford English Corpus ist ein Textkorpus des 21. Jahrhunderts Englisch, von den Machern des Oxford English Dictionary und nach Sprache Forschungsprogramm Oxford University Press verwendet. Es ist die größte corpus seiner Art, fast 2,5 Milliarden Wörter beinhalten. Es umfasst die Sprache aus dem Vereinigten Königreich, den Vereinigten Staaten, Irland, Australien, Neuseeland, der Karibik, Kanada, Indien, Singapur und Südafrika. Der Text wird in erster Linie von den Webseiten gesammelt; einige gedruckte Texte wie Fachzeitschriften, wurden gesammelt, um bestimmte Themenbereiche zu ergänzen. Die Quellen sind Schriften aller Art, von der "literarische Romane und Fachzeitschriften zu den täglichen Zeitungen und Zeitschriften und von Hansard auf die Sprache des Blogs, E-Mails und Social Media". Dies kann mit ähnlichen Datenbanken, die Probe nur eine bestimmte Art des Schreibens gegenübergestellt werden. Der Korpus ist in der Regel nur der Forscher an der Oxford University Press, aber auch andere Forscher, die ein starkes Bedürfnis kann für den Zugriff gelten nachweisen können.

Die digitale Version des Oxford English Corpus in XML formatiert und in der Regel mit Sketch Motor Software analysiert.

Jedes Dokument im OE Corpus wird durch Metadaten Namens begleitet:

  • Titel
  • Verfasser
  • Autor der Geschlechter
  • Sprachtyp
  • Source-Website
  • Jahr
  • Erhebungszeitraum
  • Domain + Subdomain
  • Dokumentstatistik
  Like 0   Dislike 0
Vorherige Artikel Pekalongan
Nächster Artikel Die Kreuzfahrt der Snark
Bemerkungen (0)
Keine Kommentare

Fügen Sie einen Kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Zeichen übrig: 3000
captcha