Andrej Karpathy
Karpathy · @karpathyOpenAI 創業メンバーで元 Tesla の AI 部門ディレクター。「Software 1.0 → 2.0 → 3.0」の概念で知られ、LLM をプログラミングのインタプリタとして捉える視点を提示。教育コンテンツ (nanoGPT、Zero-to-Hero シリーズ) でも著名。
サイト本文中で点線つきで強調された語をクリックすると、その語の解説に飛びます。新しい用語が増えたら随時更新。
OpenAI 創業メンバーで元 Tesla の AI 部門ディレクター。「Software 1.0 → 2.0 → 3.0」の概念で知られ、LLM をプログラミングのインタプリタとして捉える視点を提示。教育コンテンツ (nanoGPT、Zero-to-Hero シリーズ) でも著名。
Anthropic の CEO・共同創業者。元 OpenAI の研究担当 VP。AI 安全性と憲法的 AI (Constitutional AI) の推進者。
Google DeepMind の CEO。AlphaGo・AlphaFold で知られ、2024 年にノーベル化学賞を共同受賞。汎用人工知能 (AGI) を主目的に掲げる研究者出身の経営者。
OpenAI の CEO。Y Combinator 元社長。GPT・ChatGPT の戦略責任者として、AI 業界の方向性を牽引する人物。
Meta の Chief AI Scientist。ディープラーニングのパイオニアの一人で、CNN を実用化。世界モデル (World Models, JEPA) を推進し、自己回帰 LLM 中心のアプローチに対しては慎重派として知られる。
Claude シリーズを開発する米 AI 企業。元 OpenAI 研究者が 2021 年に創業。AI 安全性と解釈可能性研究に注力。Amazon・Google からの大型出資を受けている。
AI コードエディタ Cursor を開発するスタートアップ。VS Code をベースに LLM ネイティブな編集体験を提供し、開発者市場で急成長。
Google の AI 研究部門。Gemini・Veo・AlphaFold・AlphaGo を開発。2023 年に Google Brain と統合され現在の体制になった。
Meta (Facebook) の AI 研究組織。Llama シリーズのオープンウェイト LLM を提供し、業界のオープンソース化を牽引。
Discord ベースの AI 画像生成サービスを提供する独立系研究ラボ。フォトリアルから絵画調まで幅広い表現で人気。
ChatGPT・GPT シリーズ・Sora・Codex を開発する米サンフランシスコ拠点の AI ラボ。2015 年設立、当初は非営利、現在は営利子会社をもつ複合体。
AI 映像生成ツール Gen シリーズを提供する米スタートアップ。映画・広告制作のワークフローに AI を組み込む流れを牽引。
Elon Musk が 2023 年に創業した AI 企業。Grok シリーズのモデルを開発し、X (旧 Twitter) と統合した形でサービス展開。
Anthropic の LLM ファミリ。Opus (最高性能)・Sonnet (バランス)・Haiku (高速・低コスト) の階層。コーディング・長文処理・エージェント用途で強い。
OpenAI のコーディング特化エージェント。ターミナル・CLI 連携で大規模リポジトリ操作を行う。Gmail・Slack・カレンダー連携で業務オートメーションにも応用される。
AI 統合コードエディタ。複数ファイル横断のリファクタ、自然言語によるコード編集、エージェント実行に対応。
中国 DeepSeek が開発するオープンウェイト LLM ファミリ。コスト性能で注目を集め、Opus クラスを下回る価格で同等品質を実現。
SpAItial の 3D シーン生成モデル。1 枚の 2D 写真から 3D ガウシアンスプラットを生成し、仮想セットや背景に活用される。
音声合成 (TTS) と多言語ナレーションで業界トップクラスの品質を提供する英 AI スタートアップ。エージェントテンプレート機能も展開。
Black Forest Labs (Stability AI 元メンバーが創業) の画像生成モデルファミリ。商用ライセンス可な高品質モデルとして人気。
Google DeepMind のマルチモーダル LLM ファミリ。テキスト・画像・音声・動画を統合処理。Google ワークスペースと深く連携。
OpenAI の次世代 LLM ファミリ。長文理解・ツール統合・推論性能を重視。ChatGPT および API 経由で提供。
xAI の LLM・画像生成モデル。X 上のリアルタイム情報へのアクセスが特徴。
中国 Moonshot AI が開発する LLM。長文コンテキスト処理で先行し、Claude Opus に匹敵するベンチマーク性能を低価格で提供。
AI 画像生成サービス。プロンプトからの審美性・一貫性に強み。V7 で動画生成にも対応。
AI 動画生成プラットフォーム。MCP 経由で Claude などの LLM に動画生成・編集スキルを付与可能。
OpenAI のテキスト→動画生成モデル。高解像度・長尺の物理整合性の高い映像生成で 2024 年に話題を席巻。
Google DeepMind の動画生成モデル。音声付きの高品質な映像生成を一般提供レベルで実現したことで注目を集めた。
目標を与えると自律的に複数ステップを実行する LLM ベースのシステム。ツール呼び出し・記憶・計画立案を組み合わせ、定型業務を自動化する。
Joint Embedding Predictive Architecture。Yann LeCun が提唱する世界モデル系のアプローチ。自己回帰 LLM と異なり、抽象表現空間で次状態を予測する。
Large Language Model。数十億〜数千億パラメータを持つテキスト生成モデル。GPT・Claude・Gemini などが代表例。
Model Context Protocol。Anthropic 提案のオープン標準。LLM と外部ツール (DB・API・ファイルシステム) を接続する共通プロトコル。
Retrieval-Augmented Generation。LLM の生成時に外部知識ベース (社内ドキュメント等) を検索して文脈に注入する手法。最新情報・固有情報を扱うのに必須。
Reinforcement Learning from Human Feedback。人間の評価を報酬信号にして LLM をファインチューニングする手法。ChatGPT 以降の標準。
2017 年の論文 "Attention Is All You Need" で提案されたニューラルネットアーキテクチャ。現代の LLM の基盤。
3D シーンを大量の小さな楕円体 (ガウシアン) で表現する手法。NeRF より軽量で、リアルタイム描画と編集が可能。
Artificial General Intelligence。あらゆる知的タスクで人間と同等以上に振る舞う仮想的 AI。OpenAI・Anthropic・DeepMind 各社が目標として掲げる。
Karpathy の概念整理。Software 1.0 = 明示的にコードを書く時代、Software 2.0 = ニューラルネット重みを学習で得る時代、Software 3.0 = LLM が自然言語の指示で実行する「言語インタプリタ」時代。
事前学習済みモデルを特定タスク向けの小規模データで追加学習させる手順。LoRA・QLoRA など軽量手法が普及。
LLM から望みの出力を得るためにプロンプトを設計・最適化する技術。指示の明確化・例示・ロール付与・思考連鎖などのテクニックを含む。
Command-Line Interface。テキストコマンドで OS やツールを操作するインターフェース。bash・zsh・PowerShell など。
軽量マークアップ言語。`# 見出し` `**太字**` のような直感的記法でドキュメントを書ける。GitHub・Notion などで広く採用。
ソースコードが公開され、自由に利用・改変・再配布できるソフトウェア。AI 領域では Llama・Mistral・FLUX などが代表的。
HTTP で操作されるリソース指向の API スタイル。GET/POST/PUT/DELETE をリソースに対して使う。最も普及している Web API パターン。
Software Development Kit。特定の API・プラットフォームを使うためのライブラリ・サンプル・ドキュメントの一式。