Google кітаптарында 'Ngram Viewer' құралын қалай пайдалануға болады

Нграмма, әдетте N-грамма деп аталады, мәтіннің немесе мәтіннің статистикалық талдауы мәтіндегі қандай да бір элементті (сан) табуға мүмкіндік береді. Бұл фонемалар, префикс, сөйлемдер немесе әріптер сияқты әртүрлі нәрселер болуы мүмкін. N-грамм зерттеушіден тысқары болса да, ол әр түрлі салаларда қолданылады және адамдар табиғи тілмен түсінетін және жауап беретін компьютерлік бағдарламалар жасайтын көптеген салдары бар. Бұл, сөзсіз, Google-дің идеяға қызығушылығы болады.

Google Books Ngram Viewer жағдайда, талданатын мәтін Google Google кітаптар іздеу жүйесін толтыру үшін қоғамдық кітапханаларда сканерлеген кітаптардың үлкен көлемінен келеді. Google Books Ngram Viewer үшін олар сіз іздеген мәтінді «корпус» деп атайды. Ngram Viewer-тегі адам ағылшын тілі мен американдық ағылшын тілін бөлек талдау немесе оларды біріктіруге болады, бірақ тілмен бөлінеді. Британдықтардан американдық терминдерді қолдануға және графиктердің өзгеруін көру үшін өте қызықты болып келеді.

Ngram қалай жұмыс істейді

  1. Google Books Ngram Viewer сайтына books.google.com/ngrams өтіңіз.
  2. Элементтер Google Web іздеуінен айырмашылығы регистрді ескереді, сондықтан тиісті аттарды капиталдандырыңыз.
  3. Талдау қажет кез-келген фраза немесе сөз тіркестерін теріңіз. Әрбір фраза үтірмен бөлінгеніне көз жеткізіңіз. Google сізді «Альберт Эйнштейн, Шерлок Холмс, Франкенштейна» деп ұсынды.
  4. Содан кейін, күндер ауқымын теріңіз. Әдепкі бойынша 1800-ден 2000-ға дейін, бірақ жақында жаңа кітаптар бар (2011 жылы Google құжаттамасында ең соңғы тізімде болған, бірақ бұл өзгеруі мүмкін.)
  5. Корпус таңдаңыз. Шет тіліндегі мәтіндерді немесе ағылшын тілін іздеуге болады, және стандартты таңдаудан басқа төменде «Ағылшын (2009) немесе Американдық ағылшын (2009)» сияқты нәрселерді байқай аласыз. Олар бұрыннан жаңартылған Google корпорациясының ескі корпорациясы, бірақ ескі деректер жиынтығымен салыстыруды жүргізуге қандай да бір себеп болуы мүмкін. Көптеген пайдаланушылар оларды елемеуге және соңғы корпорацияға көңіл бөле алады.
  6. Тегістеу деңгейіңізді орнатыңыз. Тегістеу графиктің қаншалықты тегіс екендігін білдіреді. Ең нақты ұсыныс 0 деңгейінің тегістеуі болады, бірақ бұл оқуға қиын болуы мүмкін. Әдепкі бойынша, 3 мәніне орнатылады. Көптеген жағдайларда бұны реттеу қажет емес.
  1. Көптеген кітаптар түймесін іздеу түймешігін басыңыз. (Сондай-ақ, іздеуді енгізгенде ғана басуыңызға болады.)

Нграм дегеніміз не?

Google Books Ngram Viewer уақыт бойынша кітаптардағы белгілі бір фразаны пайдалануды білдіретін графикті шығарады. Егер сіз бірнеше сөз немесе сөз тіркесін енгізсеңіз, әртүрлі іздеу шарттарын қарама-қарсы ету үшін түсті кодталған сызықтарды көресіз. Бұл Google Trends-ге ұқсас, тек іздеу ұзақ уақыт кезеңін қамтиды.

Міне, нақты мысал. Біз жақында сірке сығындысы туралы сұранысқа ие болдық. Олар Laura Ingalls Wilder's Little House-те Prairie сериясында айтылған, бірақ біз мұндай нәрсені ешқашан естімеген емеспіз. Біз сірке сығышы туралы көбірек білу үшін алдымен Google веб-торабын қолдандық. Шамасы, олар американдық американдық тағамдардың бір бөлігі болып саналады және шын мәнінде сірке суы жасалады. Олар кез-келген уақытта барлық уақытта жаңа өнімге қол жеткізе алмаған кездеріне құлақ асты. Бұл бүкіл оқиға ма?

Біз Google Ngram Viewer-ді іздедік және 1940-шы жылдардың басында да, соңында да пирогтың кейбір ескертулері бар, 1940-шы жылдардағы көптеген ескертулер және соңғы уақытта еске түсіретін сандар (мүмкін, кейбір пирожныйлар ностальгии). 1800 жылдардың ішінде жазылған үстірт бар. Әр жыл сайын бес жыл бойы бір бәліш туралы айтылғандардың саны тең емес пе? Не болып жатқанын, себебі сол уақытта жарияланған көптеген кітаптар болмағандықтан және біздің деректеріміз тегіс болғандықтан, бұл суретті бұрмалайды. Бәлкім, сірке пирогын атаған бір кітаб бар еді, ал бұған қарапайым болды. Тегістеуді 0 орнатқанда, дәл осылай екендігін көреміз. 1869 жылы шыңдар орталықтарында, 1897 және 1900 жылдары тағы бір шыңға түседі.

Уақыттың қалған уақытын ешкім сірке суы туралы айтпады ма? Бәлкім, бұл тұздықтар туралы әңгіме болған шығар. Бәлкім, барлық жерде өзгермелі рецептер болған. Олар тек кітаптар туралы жазған жоқ, және бұл Ngram іздеулерінің шектеуі.

Advanced Ngram іздеулері

Ngrams әр түрлі мәтіндік ізденістерден тұратынын айтқанымызды есте сақтаңыз. Google сонымен қатар Ngram Viewer-імен де біраз төмен бұрылуға мүмкіндік береді. Егер сіз балықтың орнына балықтың орнына етістікті іздегіңіз келсе, сіз оны тегтер арқылы пайдалана аласыз. Бұл жағдайда сіз «fish_VERB» іздейсіз

Google өз веб-сайтында қолдануға болатын және басқа да кеңейтілген құжаттамалардың толық тізімін ұсынады.