Cara Menggunakan Google Ngram Lebih Efektif

Studi bahasa dan linguistik seringkali membutuhkan data tentang bagaimana kata-kata digunakan, terutama dari waktu ke waktu. Meskipun penelitian adalah suatu keharusan, memiliki alat untuk memberikan data yang Anda butuhkan dipersilakan. Google Ngram Viewer adalah cara terbaik untuk menemukan tren kata di seluruh perpustakaan Google Buku dengan cepat.

Dalam posting ini, kami tunjukkan cara menggunakan Google Ngram dengan lebih efektif. Pertama, mari perkenalkan Anda dengan alat ini.

Memperkenalkan Google Ngram

Google mengelola basis data multibahasa dari bahasa yang dipublikasikan. Dengan memindai buku secara massal, raksasa pencarian ini mampu mengolah teks dan memberikan statistik berdasarkan frekuensi kata.

Dengan GB

Jika Anda ingin memasukkan semua kapitalisasi kata, centang tombol Case-Insensitive. Pencarian ini akan mencakup “Tek” dan “teknologi”.

Di bawah kotak telusur, Anda juga dapat menyetel parameter seperti rentang tanggal dan “perataan”. Nilai terakhir menghilangkan lonjakan dan penurunan atipikal dari data Anda. Nilai pemulusan yang lebih rendah lebih tepat, sedangkan nilai yang lebih tinggi hanya menunjukkan tren yang lebih dalam.

Cara Memilih “Korpus”

Korpus adalah kumpulan teks yang akan diperiksa oleh Ngram Viewer. Default “Bahasa Inggris” dapat diterima untuk penjelajahan biasa tetapi bisa sangat akademis.

“Fiksi Bahasa Inggris” akan lebih mencerminkan bahasa umum. Korpus “Bahasa Inggris” standar bisa jadi berat non-fiksi dengan banyak kata teknis.

Sementara makna yang lebih dalam di balik korpus pilihan Anda berada di luar cakupan bagian ini, GB

Ngram Viewer akan menampilkan frekuensi relatif istilah pencarian Anda dalam satu grafik. Di sini, Anda dapat mengarahkan kursor ke garis grafik untuk melihat titik data yang tepat.

Anda juga dapat menggunakan tanda bintang dalam istilah penelusuran sebagai karakter pengganti. Misalnya, “Sarjana *” akan memberikan hasil untuk banyak gelar Sarjana.

Untuk menemukan semua GB

Jika sebuah kata mencakup banyak bagian ucapan, Anda dapat lebih spesifik menggunakan operator teks. Bagian ucapan yang valid dalam basis data Google mencakup semua hal berikut:

_ADJ_ : kata sifat (cepat, besar, pintar) _ADV_ : kata keterangan (cepat, nanti, selalu) _PRON_ : kata ganti (mereka, itu, kita) _DET_ : penentu atau artikel (a, an, the) _ADP_ : adposisi (preposisi dan postposisi) _NUM_ : numeral (pertama, kedua, kelima) _CONJ_ : konjungsi (and, nor, but) _PRT_ : partikel, yang merupakan kategori catchall, jarang digunakan untuk fungsi kata lainnya

Masing-masing dapat digabungkan menjadi frase. Misalnya, “_ADJ_ boy” akan menghasilkan pasangan kata untuk kata sifat dan “boy”.

Untuk menentukan bagian ucapan tertentu untuk satu istilah penelusuran, tambahkan kata tersebut di bagian akhir. Misalnya, “water_VERB” tanpa garis bawah. Untuk menyertakan setiap bagian ucapan untuk kata tertentu, gunakan operator wildcard setelah garis bawah.

Variabel Fungsional, Komposisi, dan Ketergantungan

Variabel fungsional memungkinkan Anda mencari berdasarkan fungsi atau penempatan kata.

_ROOT_ adalah placeholder untuk akar pohon parse kalimat. Ini biasanya subjek utama atau kata yang dimodifikasi oleh kata kerja. _START_ menunjukkan awal kalimat. (“_START_ President Obama” mengembalikan hanya kalimat yang dimulai dengan frase “Presiden Obama.”) _END_ menunjukkan akhir kalimat. (“_ADP_ _END_” mengembalikan kalimat yang diakhiri dengan preposisi.)

Dengan menggabungkan istilah pencarian dengan operator aritmatika, Anda dapat melakukan analisis matematika sederhana dengan nilai frekuensi istilah:

+ menambahkan beberapa ekspresi ke dalam satu istilah penelusuran – mengurangi ekspresi di sebelah kanan dari ekspresi di sebelah kiri, menyediakan cara cepat untuk membandingkan penggunaan relatif dari dua istilah penelusuran. / membagi ekspresi di sebelah kiri dengan ekspresi di sebelah kanan * mengalikan ekspresi untuk membandingkan ngram dengan frekuensi yang sangat bervariasi. Pastikan untuk menyertakan seluruh ngram dalam tanda kurung untuk menghindari penguraian tanda bintang sebagai karakter wildcard. : (titik dua) mencari ngram di sebelah kiri di dalam korpus di sebelah kanan.

Terakhir, Anda dapat menyetel dependensi dengan “=>” untuk mencari hubungan linguistik.

Misalnya, “car=>fast” akan menampilkan hasil di mana “fast” secara tata bahasa bergantung pada, atau memodifikasi, kata “car”. Ini dapat dicampur secara bebas dengan salah satu operasi pencarian lanjutan.

Kesimpulan

Mencari tren kata memiliki banyak aplikasi akademis. Cara cepat untuk menemukan informasi yang Anda butuhkan adalah alat Ngram Google. Kabar baiknya adalah tidak hanya memungkinkan Anda melakukan pencarian dasar. Anda dapat menerapkan pengubah yang kuat untuk mengasah informasi yang Anda butuhkan.

Tak satu pun dari fungsionalitas Google Ngram akan dimungkinkan tanpa geraman canggih mesin pencari di bawah tenda. Apakah Anda terkesan dengan apa yang dapat dilakukan alat Google Ngram? Beri tahu kami di bagian komentar di bawah!

Related Posts

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *