AI Shift Academy

50 Episodes

Reverse

Voicebot開発の現場② #10(後編)

2026-03-0522:47

AI Shift Academy（#シフアカ）前回に引き続き、ボイスボット開発の現場を支えるエンジニアたちが、LLM（大規模言語モデル）の登場による「破壊的進化」と、その裏に隠された「泥臭い苦労」を赤裸々に語ります。【今回のトピック】LLMと「速度」の壁： 0.1秒の遅延が致命傷になる音声会話の世界。「間（ま）」の恐怖：人間はなぜ1秒の無音に耐えられないのか？フィラー（えーっと、少々お待ちください）の重要性：違和感を消すためのエンジニアの工夫。音声認識の罠：「チャンネル登録お願いします」と勝手に話し出すハルシネーション問題。技術の総合格闘技：音声認識、LLM、音声合成を組み合わせる難しさ。最先端のAI技術を「実用」レベルに落とし込むための、現場ならではの試行錯誤が詰まったエピソードです。ぜひ最後までお楽しみください！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

Voicebot開発の現場② #10(前編)

2026-02-2522:17

AI Shift Academy（#シフアカ）今回のテーマは、以前も取り上げたボイスボット（音声対話システム）開発の裏側に迫る第二弾前編です。LLM登場以前、ボイスボットはIVR（自動音声応答）と併用されることが多く、開発現場では特有の課題がありました。・「55」や「9」など、数字・アルファベットの音声認識の難しさ・「はい/いいえ」の単純な質問に、ユーザーが長々と背景を語ってしまう問題・渋谷、戸田市、246号線など、地名や略称の認識エラー・ハンズフリー通話による雑音混入と認識精度の低下など、テキストのチャットボットにはない音声ならではの苦労話をAI Shiftの二人が語ります。▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

AI時代に読み返すSFが、想像以上に「今」だった話 #9

2026-02-1823:08

AI Shift Academy（#シフアカ）今回のテーマは「SF作品と現在のAI」。MLエンジニアの曽田が、AI開発に携わる今だからこそ感じるSF作品のリアリティや、現代技術との共通点について語ります。星新一『肩の上の秘書』に見るChatGPT的な意図解釈、アイザック・アシモフ『われはロボット』から考えるAIへの愛着、テッド・チャン作品における「AIの育成」など、古典SFが示唆していた課題を深掘り。また、カスタマーサポートAIに「謝罪」を求める人間の心理や、AIアバターに対する独特なコミュニケーションなど、技術の進化に伴う人間側の行動変容についても議論します。SFはもはや予言書？技術者視点のSFトークをお楽しみください！【トークテーマ】星新一『肩の上の秘書』とChatGPTアシモフ『われはロボット』とAIへの愛着テッド・チャン作品とAIの育成AIに対する人間の心理・行動▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

Local LLM #8

2026-02-1130:07

AI Shift Academy（#シフアカ）今回は、2023年の登場以降、再び注目を集めている「ローカルLLM」を特集！クラウド型のAI（ChatGPTやGeminiなど）が主流の今、なぜあえて自前環境でAIを動かす「ローカル」が熱いのか？そのメリットから最新の技術動向まで、エンジニアの視点で分かりやすく深掘りします。ローカルLLMとは？：自前環境でAIを動かす定義と、OSS（オープンソース）との違いなぜ今、再注目されているのか：モデルの軽量化やハードウェアの進化、精度の向上についてローカルLLMを選ぶ4つの理由：機密性とセキュリティ：社外秘データを安全に扱うコストパフォーマンス：高リクエスト環境での逆転現象ガードレールのカスタマイズ：特定の役割への特化（悪役ロールプレイなど）文化的多様性と安全保障：日本独自の文化継承やAI自給率の観点主要モデル紹介：Llama 3、Qwen、Gemma、DeepSeekなど、今すぐ試せる注目モデル手軽にローカルLLMを試してみたい方は、以下のソフトウェアがおすすめです。Ollama：エンジニア以外でも使いやすいUILM Studio：直感的な操作でモデルを動かせる▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

Chatbotの歴史と技術を紐解く #7(後編)

2026-02-0426:02

AI Shift Academy（#シフアカ）今回は、前回に引き続き「LLM登場以前のチャットボット」の歴史と技術（後半）です。シナリオ型（ルールベース）ならではの、「無限に増える分岐」や「表記ゆれへの対応」など、当時の泥臭い開発の裏側を語ります。【今回のハイライト】シナリオ型の限界：複雑化する分岐とメンテナンスの地獄、「その他」ばかり選ばれる問題。言葉のゆらぎ：「はい/いいえ」で答えられない曖昧な返答や、表記ゆれ（iPhone vs アイフォンなど）への手動対応。人間 vs ボット：文脈を無視した相談や、ボット相手への不満など、コミュニケーションの難しさ。今ではChatGPTなどが自然に行っている処理も、当時は手動と工夫で乗り越えていました。技術の進化と当時のエンジニアの奮闘をぜひお聴きください！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

Chatbotの歴史と技術を紐解く #7(前編)

2026-01-2824:47

AI Shift Academy（#シフアカ）チャットボットの「FAQ型」と「シナリオ型」の違いと、それぞれの運用課題について深掘りします。FAQ型は、ユーザーの質問に対して事前に用意したQ&Aから回答を検索するタイプ。一見シンプルですが、実際には・表記ゆれや類義語の認識精度・「解決しましたか？」というフィードバックボタンの押下率の低さ・質問意図の汲み取り不足など、運用担当者を悩ませる課題が山積みです。これらの課題に対する具体的な解決策や、ユーザー体験を向上させるためのヒントを語ります！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

RAGって実際どうなの？ #6(後編)

2026-01-2119:38

AI Shift Academy（#シフアカ）後編では、RAGシステムの運用フェーズにおけるリアルな課題に迫ります。RAGを導入したものの、精度評価が難しく、結局担当者の感覚（バイブス）で「良くなった気がする」と判断してしまう「バイブスチェック問題」。定量的な評価指標の欠如や、ユーザーの質問リテラシーによる検索精度のばらつきなど、運用現場ならではの悩みを紹介します。さらに、AIに過度な期待を寄せる「魔法の箱」幻想と現実のギャップ、そして継続的なナレッジ更新の難しさについても議論します。▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

RAGって実際どうなの？ #6(前編)

2026-01-1423:42

AI Shift Academy（#シフアカ）今回はAIワークフロー構築において欠かせない技術「RAG（検索拡張生成）」の現場の課題に焦点を当てます。#1でも取り扱いましたが、AIに社内ドキュメントなどの外部知識を参照させるRAG。一見便利な技術ですが、実際に開発してみると・表記ゆれやフォーマットの乱れによる検索精度の低下・LLMへのコンテキスト過多によるハルシネーション・「分かりません」と正直に言えないAIの挙動など、様々な壁にぶつかります。AI ShiftのMLエンジニア目線で、実務で直面した具体的な課題と、現時点での解決アプローチを赤裸々に語ります。▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

AIワークフロー構築の落とし穴 #5

2026-01-0726:13

AI Shift Academy（#シフアカ）今回は、AI開発の現場で起こりつつある新たな課題「AIワークフローのコンテキストオーバー」について、AI Shiftの及川と戸田が深掘りします！複数のAI処理を繋げて自動化する「AIワークフロー」・プロンプトに気合いを入れすぎて情報過多に・1つのワークフローに詰め込みすぎて複雑化など、中級者が陥りがちな落とし穴を実例を交えて解説。「Few-Shot」が逆にハルシネーションを招いた失敗談や、業務棚卸しの重要性など、2025年以降のAI開発に必須の知見をお届けします。▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

【後編】Voicebot開発の現場 #4

2025-12-2419:26

AI Shift Academy（#シフアカ）前回に続き、ボイスボット開発の裏側を深掘り！今回は、AIと人間らしい対話を実現するための試行錯誤に焦点を当てます。・ストリーミング認識の落とし穴スムーズな会話のために導入したストリーミング認識。しかし、「どこで会話を切るか」という難問に直面。ボットが「ずっと空気を読んでしまう」現象とは？・人間らしさ vs 機械のわかりやすさ人間のような「間」や「相槌」は本当に必要なのか？あえて機械的に振る舞うことで、ユーザーの心理的ハードルを下げる逆説的なUX設計について議論します。・アバター接客の衝撃体験ホテルでのアバター接客から見えた、プロの接客術とAIの現在地。最新のLLMでも超えられない「文脈理解」の壁とは？・割り込み機能「バージイン」の失敗談ユーザー体験向上のために実装した「割り込み機能」が、なぜ全く使われなかったのか？技術とユーザー心理のギャップに迫ります。▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

【前編】Voicebot開発の現場 #4

2025-12-1716:33

AI Shift Academy（#シフアカ）今回のシフアカは、方向性を変えて開発の「現場トーク」をお届けします！テーマは、AI Shiftのプロダクト「ボイスボット」の立ち上げ秘話。2019年、ボイスボットの始まりは「秘書さんサポート」だった！？「土日」が「兄貴」に聞き間違えられるなど、精度がまだ低く、運用が定まっていなかった当時の音声認識とどう戦ったのか。・独自の「聞き間違い辞書」の作成・「こう言ってください」と誘導するUXの工夫など、LLM登場以前のエンジニアの泥臭い試行錯誤を語ります！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

「音声対話」最新の音声対話技術について #3-5

2025-12-0324:02

AI Shift Academy（#シフアカ）パイプラインからE2Eへ！最新音声対話技術の現在地人間のように自然で低遅延な対話を実現する「E2E型音声モデル」へのパラダイムシフトを徹底解説します。・ Half-duplex vs Full-duplex爆速応答の「LLaMA-Omni」と、話しながら聞く同時双方向を実現する「Moshi」。それぞれのアーキテクチャと訓練手法の違いとは？・技術の裏側OpenAI Realtime APIの「擬似」Full-duplexの仕組みや、音声コーデック「Mimi」によるトークン化（Semantic/Acoustic）の構造を深掘り。・課題と展望対話データの不足やセキュリティ評価、今後のマルチモーダル化について議論します。音声AIの最前線をキャッチアップしたい方は必聴です！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

「音声対話」対話システムの歴史 #3-4

2025-11-2616:42

AI Shift Academy（#シフアカ）今回のテーマは「対話システムの歴史と未来」です。音声対話の基礎となるテキスト対話の進化を、1966年の元祖ELIZAから最新のLLMまで深堀りします。・ELIZAとSHRDLU：黎明期の対話と擬人化現象・主導権の変遷：一方通行から混合主導型へ・技術の進化：ルールベースから確率モデル、深層学習へChatGPT以降、AIは言葉を理解できるようになりました。では次の競争軸は何か。答えは理解の正確さから「体験の心地よさ（UX）」へのシフトです。技術の先にある、これからの対話デザインの核心に迫ります！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

「音声対話」対話管理と対話制御モデルの変化 #3-3

2025-11-1918:14

AI Shift Academy（#シフアカ）今回のテーマは、音声対話システムの核心「対話制御とモデルの変化」について。ユーザーの発話をAIはどう理解し、記憶し、次の応答を決めているのか？NLU（理解）→DST（記憶）→Policy（決定）という「対話の脳みそ」の仕組みを徹底解説します！▼主なトピック・ASR（音声認識）のストリーミング進化・対話制御3モジュールの役割と連携・LLM登場による「パイプライン型」から「End-to-End型」への構造変化・精度と柔軟性を両立する「ハイブリッド型」の現実解「AIがどう考えて話しているか」を知れば、技術トレンドがより深く見えてきます。是非ご視聴ください！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

「音声対話」ターンテイキングと音声対話システム #3-2

2025-11-1225:31

AI Shift Academy（#シフアカ）なぜ私たちはスムーズに会話のキャッチボールができるのでしょう？今回のテーマは「ターンテイキング」（話す・聞くの順番交代）です。人間は相手の話の終わりを予測し、わずか0.2秒で交代していると言われます。この複雑な仕組みをAIでどう実現するのか？ターンテイキングの基礎、読み取る手がかり（声のトーン、視線など）から、LLMを活用した最新AIモデル（Turn GPT, VAP）、音声対話システムでの重要性（UX向上、「バージイン（割り込み）」）まで詳しく解説。会話AIの「間（ま）」の秘密に迫ります！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

「音声対話」音声対話システムの全体像と変遷 #3-1

2025-11-0524:00

AI Shift Academy（#シフアカ）ChatGPTのボイスモードなど、AIと「声」で話す仕組み＝「音声対話システム」が急速に進化しています。かつては、(1)音声検出 → (2)文字化 → (3)意図理解 → (4)文脈把握 → (5)応答決定 → (6)文章生成 → (7)音声合成、という7つの専門分野を組み合わせる「パイプライン型」が主流でした。しかし、この方法ではエラーが伝播しやすく、全体最適化が困難でした。現在は、LLMを中心に多くを統合する「End-to-End型」が標準に。さらに、音声のトーンや感情をそのまま理解する研究も進んでいます。とはいえ、人間のように自然な「間」で会話を切り返す「ターンテイキング」や応答速度にはまだ課題も。音声対話の技術的な変遷と未来の課題を解説します！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

#2 番外編〜言語処理学会「YANS」紹介〜

2025-10-2917:54

AI Shift Academy（#シフアカ）#2番外編として、ゲストパーソナリティの栗原から、言語処理学会「YANS」について紹介します。毎年実施されている言語処理学会「YANS」20代〜30代前半の研究者が中心で、活気ある雰囲気が特徴です。発表者と直接対話できる「ポスターセッション」がメインとなっており、参加者が自由にディスカッションできる場となっています。番組では、特に印象的だった研究として、「言い淀み」や「ノリ」といった即興性を含むリアルな会話の再現を目指す「自発音声」の研究を紹介。また、LLM（大規模言語モデル）を活用したデータセット作成など、学会で見られた最新の研究トレンドにも触れています。AI研究の最前線がわかるエピソード、ぜひお聴きください！▼おたよりは⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠から

「AIの評価」今後のAI評価 #2-5

2025-10-2218:32

AI Shift Academy（#シフアカ）AIの「賢さ」を測るモノサシが変わる？従来の「難しい問題が解けるか」という評価（ベンチマーク）だけでは、AIの真の実力は測れなくなりつつあります。これからのAI評価は、・ウェブ探索能力 (BrowseComp)・ツールの使い方 (LiveMCP)・研究能力や洞察の深さ・マルチモーダルや対話能力など、より実践的なスキルが問われます。また、「Chatbot Arena」のようなユーザー投票や、人間が評価ループに入る「Human-in-the-Loop」も再注目されています。「AI版ムーアの法則」と呼ばれるタスク完遂速度や、安全性・バイアス（RedTeaming, HELM）など、評価軸はどんどん複雑で多角的に。AI評価の未来を解説します！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠から

「AIの評価」評価の課題 #2-4

2025-10-1526:37

AI Shift Academy（#シフアカ）TECH BLOG「LLM-as-a-Judgeにまつわるバイアスまとめ」はこちらから。今回は「AIの評価」評価における課題についてお話しています。特にLLMの性能評価における信頼性の問題を深掘りします。今回の放送では、AI評価者や人間に内在し、結果を歪める「バイアス」の体系的な分析から始めます。さらに、評価データが学習データに混入する「データ汚染」が如何にベンチマークを無意味にするか、そして評価AIの癖に最適化し実用性を損なう「ジャッジへの過適応」の危険性を指摘。問題設定自体の誤りや環境依存性といった、スコアの再現性を揺るがす要因も解説。AIの能力を正しく見極める上で、開発者や研究者が直面する深刻な課題を論じます。▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠⁠から

「AIの評価」LLM as a Judge #2-3

2025-10-0919:49

AI Shift Academy（#シフアカ）今回は「AIの評価」LLM as a Judgeについてお話しています。従来のAI評価は、自動指標では精度に、人手評価ではコストと時間に大きな課題がありました。そこで登場したのが、GPTのような高性能LLMを「評価者」として使う新手法「LLM as a Judge」です。人間による評価と遜色ない精度を実現しつつ、高速・低コストで大規模な評価を可能にします。評価の質はプロンプト設計が鍵を握り、明確な基準を与えることで人間の判断をスケールさせることができます。RAGの性能評価や、AIからのフィードバックでAIを強化するRLAIFなど応用も多彩。AI開発の常識を変えるこの技術を詳しく解説します！▼おたよりは⁠⁠⁠⁠⁠⁠⁠⁠こちら⁠⁠⁠⁠⁠⁠⁠⁠から

#box-pro-ellipsis-177363954705251{-webkit-line-clamp:2;}AI Shift Academy