解説：自然言語処理

このページでは「自然言語処理（NLP）とディープラーニングの応用例」（シラバス項目27・30〜34）を解説します。ChatGPTなどの生成AIに直結する最重要分野です。

💬 27. 自然言語処理（NLP）とは

自然言語処理（Natural Language Processing: NLP）とは、人間が使う言語（テキスト・音声）をコンピュータで処理・理解・生成する技術です。

用語	説明
word2vec	単語をベクトルで表現する手法。意味的に近い単語は近いベクトルになる
BERT	Googleが開発した双方向Transformerモデル。文の文脈を深く理解する
GPT-n（GPT-3/4など）	OpenAIが開発した大規模言語モデル（LLM）。ChatGPTの基盤
LLM（大規模言語モデル）	膨大なテキストデータで学習した超大規模なAI言語モデル
ChatGPT	GPT-4をベースにしたOpenAIの対話型AIアシスタント
Seq2Seq	入力系列から出力系列を生成するモデル。機械翻訳の基本構造
形態素解析	文を意味のある最小単位（形態素）に分割する処理
TF-IDF	文書中の単語の重要度を測る指標

技術	説明
GAN（敵対的生成ネットワーク）	生成器と識別器が競い合いながら学習。リアルな画像を生成できる
Diffusion Model（拡散モデル）	ノイズから画像を生成する最新の手法。Stable DiffusionなどのAI画像生成の基盤
CycleGAN	ペアのない画像同士のスタイル変換ができるGANの派生手法
NeRF	2D画像から3Dシーンを再構成する技術

技術	説明	キーワード
転移学習・ファインチューニング	大規模モデルの学習済みパラメータを別タスクに転用する	Few-shot、One-shot、破壊的忘却、RLHF
マルチモーダル	テキスト・画像・音声など複数の形式を組み合わせて処理する	CLIP、DALL-E、Text-To-Image、Zero-shot
モデルの解釈性（XAI）	AIの判断根拠を人間が理解できる形で説明する	CAM、Grad-CAM、LIME、SHAP
モデルの軽量化	大きなモデルを小さく・速くする技術。エッジAI向け	量子化、蒸留、プルーニング

コンピュータが自然言語を処理するには、文字や単語を数値に変換する必要があります。G検定ではこれらの表現手法の概念が問われます。

手法	説明
Bag of Words（BoW）	文章中の単語の出現頻度を特徴量にする手法。単語の順序は無視する
TF-IDF	単語の重要度を「文書内の出現頻度」と「全文書での希少性」で評価する手法
word2vec	単語を低次元のベクトルに変換する手法。意味的に近い単語は近いベクトルになる
BERT	Transformerを用いた事前学習モデル。文脈に応じた単語の意味を捉えられる
GPT	大規模な言語モデル。テキスト生成が得意で、ChatGPTの基盤技術

NLPは様々な実用的タスクに応用されています。G検定ではこれらのタスクが何をするものかを理解しておくことが重要です。

自然言語処理分野では、形態素解析・word2vec・Transformer・BERT・GPTがとくに頻出です。それぞれの仕組みの概要と、どんな問題を解くために使われるのかをセットで覚えておきましょう。近年の試験では大規模言語モデル（LLM）に関する問題も増えています。