marulaゼミ「AIエージェント講座」

AIエージェント講座

動画の再生リストは、こちらからアクセスできます。
https://www.youtube.com/playlist?list=PLTCzV3aLjJ1RhuweI3k570Uny6fXakyei

番外編「LLM 比較 超便利サイト実演+業界ネタ !」

LLM の性能比較

LLM の性能比較でとても重宝するサイト「Artificial Analysis」を実際に使ってみながら、今話題の DeepSeek や NN専用ハードでの実行速度 等、業界ネタも織り交ぜながら、ご紹介いたします。

Artificial Analysis の URL:https://artificialanalysis.ai
LLM API Providers Leaderboard:https://artificialanalysis.ai/leaderboards/providers

アンケートへのご協力のお願い

marula 配信の進め方を決めるにあたって、アンケートをお願いしています。 アンケートフォームの URL はこちらです:

https://docs.google.com/forms/d/e/1FAIpQLSeZI_1DKZXr2LnfAdXsMzKWv08Iw22s7cdN67aNxgi3QfI7ng/viewform

お忙しい中大変恐縮ですが、ぜひご回答の方どうぞよろしくお願いいたします!

さらにFYI

DeepSeekhttps://www.deepseek.com
Groq、cerebras、SambaNova 各社の AIアクセラレーションの特徴

Groq :独自のシンプルかつ決定論的なデータフロー設計を採用。演算の流れをストリーミングすることで、低レイテンシと高スループットを実現。

Cerebras Systems :世界最大級のウェハースケールエンジン(WSE)を搭載し、1枚のウェハ上に数千のコアを集積。これにより、非常に大規模なディープラーニングモデルの学習を効率的に行う。

SambaNova Systems :ハードウェアと独自のソフトウェアスタックを一体化したシステム(データフローアーキテクチャを採用)を提供。これにより、エンタープライズ向けの幅広いAIワークロードに柔軟に対応。

第3回「超有能 A I リサーチャー爆誕 !」

OpenAI の 次世代AIエージェント「Deep Research」のデモ動画です!

「5〜30分程度で人間の「数十時間」分の作業を実行可能」
「研究アナリストレベル の包括的なレポートを作成できる」
といった主張・評判を「AIエージェントの最新動向」について調査してもらい、検証します。

プロンプトで指示した調査を、Deep Research が自動で遂行していく様子が、通しで見られます。

Deep Research の作成したレポート

「自律AIエージェントの最新動向と2025年の展望」

 [AIとの会話履歴] https://chatgpt.com/share/67aec983-dee8-8010-92e0-40ca966b1ee2
 [Google Docs への転写] https://docs.google.com/document/d/1xFdFwha6djRhh2vzkHlZUHCKLZHWs88Rq56s2G8eEq4/

「AIエージェントVTuberチャンネルの成長戦略」

 [AIとの会話履歴] https://chatgpt.com/share/67aec959-a3ac-8010-86e8-a17d9a8bd2f4
 [Google Docs への転写] https://docs.google.com/document/d/1kURG5VFLxNrYTW3sySYZRfpw2h9sZtHmrZYxY426mpU/

Open Deep Research

Hugging Face の面々が開発した Deep Research クローン
 [GitHub] https://github.com/huggingface/smolagents/tree/main/examples/open_deep_research

第2回「AI がアプリを自動開発 ⁉︎」

AI によるアプリ生成のデモ動画です!

最近進化の激しい「AI エージェント」の能力を具体的に理解するために、Replit Agent を使って「AI によるアプリの生成機能」を実際に動かしてご紹介します。

プロンプトで指示したアプリを、AI Agent がユーザに確認を乞いながら自動で生成していく様子の全体が、通しで見られます。

実際の AI チャット・ボットのコード

Replit Agent が生成した実際の AI チャット・ボットのコード https://github.com/hideya/test-marula-ai-chat

AI 技術動向まとめ記事


 ・「NVIDIAも焦点当てる「エージェントAI」、すでに「前例ない」レベルで利益を生み出すほどの影響力」
 https://news.yahoo.co.jp/articles/e5445ad4c61f2b83f8e9b78b184da906db363a19
 ・「AI エージェントの事例5選、ウォルマート、NEC、NTTデータの “面白い活用法” を解説」(ビジネス+IT 2024年12月)
  https://www.sbbit.jp/article/cont1/152258

第1回「AI が PC を操作⁉︎」

AI が PC を操作するデモの実施動画です!

最近進化の激しい「AI エージェント」の能力を具体的に理解するために、「AI が PC を操作する」というデモ「Anthropic の Computer Use」を実際に動かしてご紹介します。

テキストで入力した大雑把な指示にしたがって、スクリーンショットをとおして画面を「見て」理解し、AIエージェントが進め方を考えて、マウス操作やキーボード入力をしていく様子全体が。通しで観られます。

Anthropic Computer Use Demo

・Anthropic Computer Use Demo の github リポジトリ:
 https://github.com/anthropics/anthropic-quickstarts/tree/main/computer-use-demo

実際の手順等の説明

以下のページをご参照ください

 ・「Anthropic Computer Use のクイックスタートを試してみる」
  https://qiita.com/kooohei/items/e9dc6dd7da269eb45b9c
 ・「「Computer Use」Anthropic社のClaudeがPCを操作する新機能を使ってみた」
  https://smooz.cloud/news/column/computer-use-anthropic/