大規模言語モデルの仕組み（１）：単語のベクトル化（埋め込み）

テキスト

内容
ライブラリ

1. はじめに

LLMの仕組みを理解することは、この技術の力だけでなく、その限界を理解する上でも非常に重要です。

私たちは大規模言語モデル（LLM）と日常語（自然言語）—プロンプトとも呼ばれます—でやり取りし、LLMは文章（テキスト）を生成します。その出力は、特に数学や論理的な問いが含まれるプロンプトに対しては、非常によく考え抜かれた回答のように見えることがあります。LLMはどのようにしてそれを実現しているのでしょうか？

大まかに言えば、LLMは入力として与えられた単語の並びを受け取り、その続きとして最も確率の高い単語を予測します。たとえば、スティーブン・ウルフラム氏はその著書（巻末）の中で、“小論文を書くときなどにやっていることは、本質的には「ここまでの文章を踏まえると、次の単語は何になるべきか？」という問いを何度も何度も繰り返し、そのたびに単語を1つずつ追加しているだけなのだ”と述べています。

このプロセス、つまり生成した単語を元の並びに追加してから再び自分自身に入力として与え、次に最も確率の高い単語を生成するという流れは、「文末トークン（EOS）」と呼ばれるものが生成されるまで繰り返され、それがテキスト生成の終了を意味します。

しかし、LLMは実際にはどのようにしてそれを実現しているのでしょうか？LLMは―少なくとも現在の仕組みでは―根本的には数値に基づいています。したがって、文章（テキスト）のようなものを処理するためにLLMを使おうとするなら、そのテキストを数値で表現する方法が必要になります。

続きを表示するには、入会が必要です

AI時代の知的鍛錬塾（メルマガ）

もっとライブラリを見る

ご入会手続き中に完売することもございます。

販売価格	サロン料金	入会／詳細
入会後無料 ※退会後閲覧可詳細はこちら	550円/1ヶ月ごと	入会する

サロンに入会中または購入済みの方はこちら

続きを閲覧するには、DMMアカウントへのログインが必要です。

フォローしたサロンの情報を、ご登録のメールアドレスにお届けします。

サロンをフォローする

※フォローはログイン後に反映されます。

オンラインサロン情報

AI時代の知的鍛錬塾（メルマガ）

550円/1ヶ月ごと

サロンページを見る

サロン紹介

情報を追うだけでは、もう足りない。これから必要なのは、本質を見抜き、自分で考える力。 AI時代の知的鍛錬塾の内容の一部を川口有一郎による解説付きでメルマガ配信していきます。

運営ツール: DMMオンラインサロン専用コミュニティ

大規模言語モデルの仕組み（１）：単語のベクトル化（埋め込み）

AI時代の知的鍛錬塾（メルマガ）

サロンに入会中または購入済みの方はこちら

#0016 確率と1回きりの出来事

#0015 私のRisk Savvy

#0014 線形代数は慣れれば便利なツール

#0013 多角化戦略か特化戦略か

#0012 バリュー投資の科学と日本株スクリーニング戦略

#0011 ハードサイエンスvsソフトスキル投資の3冊

#0010 IRLSと統計計算の舞台裏

「楽になる」はずだったのに ―― AIはなぜ私たちを疲れさせるのか

#0009 株式リターンの謎と時間変化するファクターモデル

#0008 カーネル回帰モデルの本質と、AI時代の「バカの落とし穴」

自分のもとめる知識を探す方法

なぜ大学入試で首席合格できるのか?

生成AI利用に際しその仕組みをどの程度しっておくべきか：知的生産の作法

#0007 確率場と確率微分方程式 — 時空モデリングへの第一歩

AIは本当に「言葉の意味」を理解しているのか—「確率的なオウム」か

知的鍛錬の原理と方法は古びない

#0006 もう一歩の哲学 — 松下幸之助とEurekaの瞬間

#0005 社会科学系大学院における統計教育の10大課題

#0004 確率微分方程式の2つの顔 — ブラックショールズと空間統計

#0003 投資家の期待を可視化する

AI時代の知的鍛錬塾（メルマガ）

あなたにおすすめの他サロン

Biz's Barオンラインサロン

ハピネス・デザイン－ウェルビーイングを高め、自分らしく咲き誇るために－

Sol Naciente Socio

ビジネスオンラインサロン「スナック止まり木」 応援される人に私はなる！

ねてる リカバリー・コモンズ

赤くて黒い空間

YUKI式 似合わせ眉スクール 16期

はらだんDMMオンラインサロン プロニートの歩き方

AI進化ラボ｜収益化実践プログラム

KANPO FRIENDS CLUB

CFO思考でつくる「キャリア×資産形成ラボ」

BikeJIN TOURING CLUB

アイロン仕上げの竜光

J’sland

絵本フェスLABO

武蔵野算命塾

良縁を結ぶ！luxeコミュニケーション講座

シント＝トロイデンVV ビジネスサロン

介護サロン

立川談笑「らくご長屋」

ビジネスオンラインサロン「スナック止まり木」応援される人に私はなる！

ねてるリカバリー・コモンズ

YUKI式似合わせ眉スクール 16期

はらだんDMMオンラインサロンプロニートの歩き方