KOMPASやTEMPOのニュース記事の分析結果を公開しています.
このサイトでは、インドネシア語の単語・熟語の出現頻度やコロケーションを調べることができます。 分析用のデータはインドネシアのニュースサイトの文章のみ。 ネイティブのインドネシア語に絞って分析することができます。
単語・熟語は実際どう使われている?
辞書には単語の意味が載っています。 しかし、単語がどの程度使われているか(頻度)、他のどの語とよく一緒に使われているか(共起・コロケーション)までは分かりません。
当サイトでは頻度やコロケーションを調べることができます。インドネシア語の単語・熟語が実際にどのように使われているかを確かめることができます。
データの信頼性は?
当サイトではインドネシアのニュースサイトに絞ってデータを分析しています。 特に、KOMPASとTEMPOによるニュース記事を分析しています。 「インドネシア」「ニュースサイト」と範囲は絞っていますが、そのカテゴリーが分析の目的に沿えばデータの信頼性は高いはずです。
一方で、Googleなどの検索サイトでも意味・頻度・コロケーションなどを調べるのことができます。 しかし、様々な国や人々の英語が混じっているのが欠点です。 膨大なデータから調べられるという利点もありますが、非ネイティブの英語も多く信頼性に欠けます。
検索の方法
検索ボックスに単語・熟語を入力して「Search」ボタンを押してください。
使用できる文字
- 半角英数: [0-9a-zA-Z]
- 半角スペース: [ ]
- 半角シングルクォーテーション: [']
- 半角アスタリスク: [*]
オプション
前方に表示する語数
検索する語句の前に表示する語数
後方に表示する語数
検索する語句の後ろに表示する語数
例:前方に1語表示・後方に2語表示・「have」を検索 → 「We have a long」が得られる(「have」の前に1語、後ろに2語表示)
1ページあたりの表示数
1ページあたりに表示する結果の数。1つのデータ(文章1段落)に複数マッチする場合は複数の結果を表示するため、ここで選択した数と異なる場合があります。
特殊文字
スペース[ ]
ハイフンでつないだ語を検索するには、ハイフン[-]のかわりに半角スペース[ ]を使ってください。
例: 「self-esteem」を検索する場合 → 「self esteem」で検索
アスタリスク[*]
ワイルドカード(何にでもマッチする記号)は半角のアスタリスク[*]です。
例: 「up * down」で検索した場合 → 「up and down」もマッチする