Dialekty Twittera

Serwis Science Daily opublikował artykuł na temat badania przeprowadzonego przez naukowców z  Carnegie Mellon University’s School of Computer Science. Wynika z niego, że na Twitterze odzwierciedlenie znajdują liczne dialekty – w tym przypadku języka angielskiego. Czy więc Twitter może służyć do nauki regionalizmów?




Przedstawione wyniki badań nie są niczym ani nowym, ani zadziwiającym, ponieważ już od dawna – od początku badań nad komunikacją komputerową (ok. lat 80 XX w.) wiadomo, że język w niektórych środowiskach komunikacyjnych Internetu jest bliski językowi mówionemu. Jednak postanowiłem zdać relację z owych obserwacji, ponieważ, po pierwsze niewiele jest prac na temat mikroblogów, a po drugie materiał językowy, choć skromny, może Was zainteresować.

Dla przypomnienia, o języku w Internecie pisałem w tych tekstach:
Angielski w Internecie
Skróty używane w SMS-ach i Internecie

Autorzy badania zebrali materiał językowy składający się z 380 tys. wiadomości wysłanych przez 9,5 tys. użytkowników. Jest to więc całkiem pokaźny korpus jak na badania w ramach CMC (computer-mediated communication).

Choć lokalizacja poszczególnych użytkowników Twittera była w zasadzie dostępna dla badaczy, to autorzy zastosowali  także metodę statystyczną, dzięki której zróżnicowanie w dobrze słów i tematów pozwoliło na określenie lokalizacji danego użytkownika z USA przy medianie błędów ok. 300 mil.

W północnej Kalifornii coś, co jest cool (super) na Twitterze jest koo. Z kolei użytkownicy z południowej Kalifornii pisali raczej coo. W wielu miastach something (coś) to sumthin, ale w Nowym Jorku dominuje suttin. Gdy ktoś jest bardzo (very)  zmęczony (tired), to na Twitterze w pólnocnej Kalifornii bywa się raczej hella tired. Nowojorczycy zaś bywają deadass tired. Mieszkańcy Los Angeles z kolei są tired af (akronim dla as fuck).

Skrótowiec af jest popularny w środowisku mikroblogowym – tak jak lol. Jednak użytkownicy Twittera w Waszyngtonie (D.C.) wolą LLS (laughing like shit).



Choć autorzy przyznają, że takie zachowania językowe mogą być determinowane specyfiką medium (maks. 140 znaków w wiadomości), to położenie geograficzne użytkowników ma wpływ na dobór form wyrazowych.

Twitter, głównie dzięki “geotagom”, oferuje nowe możliwości analizy dialektów i ich ewolucji w czasie rzeczywistym.

Autorzy zajmują stanowisko, że Internet wcale nie musi przyczyniać się do ujednolicenia zachowań językowych – a wręcz przeciwnie użytkownicy zechcą podtrzymać swoją odmienność. Mają w tym wiele racji, bo w badaniach nad aspektami społeczno-kulturowymi nie od dzisiaj mówi się o “glokalizacji” (global + local). Niemniej długoterminowe poleganie na metodzie statystycznej i przewidywanie lokalizacji użytkownika na podstawie jego słownictwa może sprowadzić badaczy komunikacji internetowej na manowce. Niektóre wyrażenia, czy ich warianty, mogą stawać się bardziej popularne od innych – mogą być przejmowane przez różnych użytkowników, bo czyż jedna osoba nie może “twitnąć”, że: “suttin is goin on and I’m tired af but it’s still koo, LLS!“?

Dla zainteresowanych tutaj jest tekst w Science Daily, a tutaj cała publikacja.

2 komentarze
  1. Nutcracker
    • mrtom

Zostaw komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

This site uses Akismet to reduce spam. Learn how your comment data is processed.