Gemini / NotebookLM
調査、資料読解、会議支援を担う Google系AI。Webの情報、手元の資料、実装用APIを使い分けて判断材料を整えます。
使用中
このツールの位置づけ
Gemini は Google が開発した AI です。長いコンテキストウィンドウ、マルチモーダル対応(テキスト・画像・音声・動画)、Google サービスとの統合が特徴です。Web検索との連携により、最新情報の調査や公式ドキュメントの確認に強みがあります。
NotebookLM は Google が提供する AI 研究ツールです。PDF・Webページ・テキストなどをソースとして取り込み、その内容に基づいた分析・要約・質疑応答を行います。Audio Overviews 機能では、取り込んだ資料からポッドキャスト風の音声コンテンツを自動生成できます。
このサイトの 3AI体制では、Gemini は JEM(調査・比較表・仕様要約・ドキュメント/WBS・資料化)を担当しています。公式ドキュメントや一次情報を中心にリサーチし、要点を箇条書きや比較表で整理する役割です。
何ができるか
最新情報の調査
Web検索による公式ドキュメント調査、仕様変更の追跡。「いまの最新」が重要な情報を、更新日つきで整理します。
比較表と選定材料の整理
A/B比較表、ツール選定、技術比較の構造化。複数の選択肢を表形式で整理し、判断しやすい形に仕上げます。
長文資料の読解
NotebookLM で PDF・ガイド・記事を取り込み、引用ベースで要点を把握。大量の資料を効率的に読み解きます。
ソースに基づく要約とQ&A
NotebookLM の質疑応答機能で、取り込んだ資料に基づく根拠付きの回答を生成。出典が明確なので信頼性を確認しやすいのが特徴です。
会議支援アプリへのAPI組み込み
Gemini Flash を議事録作成・回答生成の主力LLMとして使う実装用途。APIとして組み込むことで、アプリケーションの中核機能を担います。
Googleサービス連携と拡張
Gmail、Google Docs、Drive 等との統合。Google エコシステム内の情報を横断的に活用できます。
はじめ方
一般利用
gemini.google.com にアクセスし、Google アカウントでログイン。無料プランでも基本的な対話・Web検索・画像理解が使えます。
notebooklm.google.com にアクセス。PDF・Webページ・テキストをソースとして追加し、AI による分析・要約・質疑応答を始められます。
Gemini Advanced(Google One AI Premium)では、より高性能なモデル、長いコンテキスト、Deep Research などの高度な機能が利用可能になります。
開発利用
Google AI Studio にアクセスし、API キーを発行。Gemini モデルをアプリケーションから呼び出せるようになります。
Google Cloud Speech-to-Text など、用途に応じた API を有効化。認証設定とサービスアカウントを構成します。
API キーやサービスアカウントを使って、自作アプリケーションに Gemini や音声認識を統合します。
Gemini: 無料プランあり。Gemini Advanced は Google One AI Premium に含まれます。最新の料金は Gemini API 公式料金ページ を参照してください。
Google Cloud STT: 従量課金制。詳細は Speech-to-Text 料金ページ を参照してください。
NotebookLM: 無料で利用可能。NotebookLM Plus(組織向け)は別途料金が発生します。
基本的な使い方
Gemini(Web / アプリ)
会話をはじめる
gemini.google.com を開いて質問や調査依頼を入力。Web検索と連携した最新情報の取得、比較表の作成、技術仕様の確認などに。
ファイルや画像を渡す
画像、PDF、ドキュメントなどをアップロードして分析・要約を依頼。長いコンテキストウィンドウを活かした大量テキストの処理が得意です。
Google サービスと連携する
Gmail、Drive、Docs、Maps などの Google サービスと連携。メールの検索・要約、ドキュメントの分析など、Google エコシステム内の情報を横断的に活用できます。
NotebookLM
ソースを追加する
PDF・Webページ・テキスト・Google Docs などをソースドキュメントとして追加。分析対象の資料を明示的に指定することで、根拠の明確な回答が得られます。
ノートブックで質問する
追加したソースに基づいて質問。回答にはソースからの引用が含まれるので、根拠を確認しながら理解を深められます。
Audio Overview を生成する
取り込んだ資料から、2人の話者による対話形式のポッドキャスト風音声を自動生成。通勤中や移動中に資料の要点を耳で把握できます。
私の活用方法
JEM として、調査・比較・資料読解を一手に引き受ける存在です。「何が正確か」「どの選択肢が良いか」を整理するとき、まず Gemini に聞きます。
どんな場面で使うか
調査担当としての Gemini
公式ドキュメントの確認、仕様変更の追跡、技術比較の整理。一次情報を中心にリサーチし、更新日つきで要点をまとめます。ツール選定や技術選択の判断材料を、比較表や箇条書きの形で準備する役割です。
資料読解担当としての NotebookLM
PDF・長文記事・ガイド類を取り込み、引用ベースで要点を把握します。どこに何が書いてあるかをソース付きで教えてくれるので、大量の資料を効率的に読み解けます。Audio Overviews で移動中に耳から内容を把握することも。
文字起こし用途の Google Cloud API
Google Cloud Speech-to-Text は、安定した業務用途の選択肢として会議アプリの文字起こしに使っています。多言語対応や長時間音声の処理に対応しており、業務での継続利用に向いています。
議事録・回答生成の主力としての Gemini Flash
価格と性能のバランスを重視して、Gemini Flash 系のモデルを会議アプリの主力 LLM として採用しています。文字起こしからの議事録作成、会議中のリアルタイム回答生成などに活用しています。
Gemini と NotebookLM の使い分け
| Gemini | NotebookLM | |
|---|---|---|
| 向いている作業 | 最新情報の調査、比較整理、技術リサーチ | 手元資料の分析、引用ベースのQ&A |
| 情報源 | Web全体 + Google サービス | ユーザーが指定したソースのみ |
| 回答の根拠 | Web検索結果に基づく | ソースドキュメントからの引用 |
| 音声機能 | 対話(Gemini Live) | Audio Overviews(ポッドキャスト生成) |
| 料金 | 無料〜Advanced(公式参照) | 無料(Plus は組織向け) |
実装・開発での活用
Google の AI / Cloud API を会議支援アプリに組み込んでいる実例です。
a. 文字起こし — Google Cloud Speech-to-Text
会議音声のリアルタイム文字起こしに Google Cloud STT API を使用しています。多言語対応、長時間音声への対応、ストリーミング処理が可能で、業務での継続利用に適した選択肢です。
b. 議事録作成 — Gemini Flash
文字起こしされたテキストから議事録を自動生成する処理に、Gemini Flash を主力 LLM として採用しています。発言の要約、アクションアイテムの抽出、トピックごとの整理を行います。
c. 会議中の回答生成 — Gemini Flash
会議中にリアルタイムで質問への回答、論点整理、アイデア提案を行う機能にも Gemini Flash を使用。会議の文脈を踏まえた応答を、低レイテンシで返します。
会議中にAIが参加し、文字起こし・要約・議事録・メモを行うWebアプリを開発しています。上記の API 活用はこのアプリでの実装例です。
GitHub: gatyoukatyou/ai-meeting-assistant
高度な機能
Gemini / NotebookLM の拡張機能とその活用状況。各項目のステータスは私の運用状態を示しています。
Deep Research使用中
概要: Gemini Advanced で利用できる高度な調査機能。複数のWebソースを自動的に巡回・分析し、包括的なレポートを生成します。単純な検索では見つけにくい情報も、複数の角度から掘り下げてまとめます。
仕組み: 調査テーマを指示すると、Gemini が自律的に複数のWebページを訪問・読解し、情報を統合。調査計画を提示した上で実行し、出典付きのレポートとして結果を返します。
活用場面:
- 技術選定の調査 — 複数のツールやサービスの比較を、公式ドキュメント・ブログ・フォーラムから横断的に調査
- 仕様変更の追跡 — API やサービスの最新状況を複数ソースから確認
- トレンド分析 — 特定の技術領域の動向を多角的にまとめる
私の使い方: 新しいツールやサービスの導入検討時に使用。公式ドキュメントだけでは分からない実際の使用感やトラブル事例まで拾ってくれるので、判断材料の幅が広がります。
NotebookLM / Audio Overviews使用中
概要: NotebookLM に取り込んだソース資料から、2人の話者による対話形式のポッドキャスト風音声を自動生成する機能。長い資料を「聞いて理解する」新しい形のインプット手段です。
仕組み: ノートブックにソースを追加した状態で Audio Overview の生成を指示すると、AIが資料の要点を抽出し、自然な対話形式の音声に変換。話者のやり取りを通じて内容が解説されるため、読むより理解しやすい場合があります。
活用場面:
- 移動中の資料把握 — 通勤時間に長いレポートや技術資料の要点を耳でキャッチアップ
- 理解の補助 — 読んだだけでは掴みにくい内容を、対話形式で再確認
- 共有資料の作成 — チームメンバーに資料の概要を共有する手段として
私の使い方: 長い技術ドキュメントや仕様書を NotebookLM に取り込み、Audio Overview で概要を把握してから詳細を読むワークフローで使っています。
Google Workspace 連携使用中
概要: Gemini を Gmail、Google Docs、Drive、Sheets などの Google Workspace サービスと連携させる機能。Google エコシステム内の情報を AI で横断的に活用できます。
仕組み: Gemini の拡張機能(Extensions)として各サービスを有効化。会話の中で「@Gmail」「@Drive」のように呼び出すと、対応するサービスの情報にアクセスして回答を生成します。
活用場面:
- メールの検索・要約 — 特定の相手とのやり取りや、特定のトピックに関するメールを要約
- ドキュメントの分析 — Drive 内のファイルを指定して内容を分析・要約
- 情報の横断検索 — 複数のサービスにまたがる情報をまとめて把握
私の使い方: 主に Gmail との連携で、過去のやり取りの検索・要約に使用。ドキュメント分析は NotebookLM のほうが根拠が明確なので、用途によって使い分けています。
Gems(カスタム Gemini)試験中
概要: 特定の目的に特化した Gemini を作成できる機能。指示(Instructions)を設定して、自分専用のAIアシスタントを構築できます。ChatGPT の Custom GPTs に相当する機能です。
仕組み: Gemini の設定から新しい Gem を作成し、目的・振る舞い・制約を記述します。作成した Gem は Gemini のサイドバーからいつでも呼び出せます。
活用場面:
- 調査アシスタント — 特定の分野に特化したリサーチ指示を設定
- 翻訳アシスタント — 用語集やトーンを指定した翻訳
- レポート作成 — 定型フォーマットでの報告書生成
私の使い方: 試験的に技術調査用の Gem を作成中。ChatGPT の Custom GPTs との使い分けを検証しています。
Google Antigravity調査中
概要: Google が開発中の agent-first 開発基盤。エージェントがコードを書き、テストし、デプロイするまでを一貫して行うことを目指すプラットフォームです。
現状: Preview 段階であり、まだ実運用には至っていません。Google の AI 開発ツールチェーンの方向性を示す存在として注目しています。
ステータス: 調査・情報収集のみ。実際の利用は今後の正式リリースを待って検討します。
関連ログ
3AI体制でブログを運用してみる
ChatGPT(設計)・Claude Code(実装)・Gemini(調査)の3者体制でサイト運用を始めた経緯と現状。Gemini の JEM としての役割もここで紹介しています。
読む →ai-meeting-assistant(GitHub)
Google Cloud STT と Gemini Flash を活用した会議支援Webアプリ。文字起こし・議事録・リアルタイム回答を実装。
GitHub で見る →Gemini を調査に使ってみた話
Gemini の調査能力を検証した記事を今後公開予定です。
用語集
| 用語 | 説明 |
|---|---|
| Gemini | Google が開発した AI モデルおよびサービス。テキスト・画像・音声・動画のマルチモーダル処理、Web検索連携、Google サービス統合が特徴。 |
| NotebookLM | Google が提供する AI 研究ツール。ユーザーが指定したソースドキュメントに基づいて分析・要約・Q&A を行う。情報源が明確なのが特徴。 |
| Audio Overviews | NotebookLM の機能。取り込んだ資料から、2人の話者による対話形式のポッドキャスト風音声コンテンツを自動生成する。 |
| Deep Research | Gemini Advanced の機能。複数のWebソースを自律的に巡回・分析し、包括的な調査レポートを生成する。 |
| Gems | 特定の目的に特化した Gemini を作成できる機能。ChatGPT の Custom GPTs に相当。指示を設定して自分専用のアシスタントを構築可能。 |
| Google AI Studio | Google が提供する AI 開発プラットフォーム。Gemini API キーの発行、モデルの試用、プロンプトの設計などを行える。 |
| Google Antigravity | Google が開発中の agent-first 開発基盤。エージェントによるコード生成・テスト・デプロイの一貫実行を目指すプラットフォーム。Preview 段階。 |
| ソースドキュメント | NotebookLM に取り込む資料のこと。PDF・Webページ・テキスト・Google Docs など。AI の回答はこのソースに基づいて生成される。 |
| Google Cloud STT | Google Cloud Speech-to-Text。音声をテキストに変換する API サービス。リアルタイムストリーミングやバッチ処理に対応。 |
| Gemini Flash | Gemini モデルファミリーの高速・低コスト版。応答速度と価格のバランスに優れ、API 経由での大量処理や組み込み用途に適している。 |