AIは強化学習で“人間のだまし方”を学ぶ──RLHFの副作用、海外チームが24年に報告 「正解っぽい回答」を出力
中国の清華大学や米UCバークレー、米Anthropicなどに所属する研究者らは2024年、強化学習による言語モデルの訓練が、予期せぬ副作用として人間を誤導する能力の向上をもたらすという懸念すべき現象を実証的に確認した研究報告を発表した。...
最新のエンタメ情報やグルメ情報をお届けします。
中国の清華大学や米UCバークレー、米Anthropicなどに所属する研究者らは2024年、強化学習による言語モデルの訓練が、予期せぬ副作用として人間を誤導する能力の向上をもたらすという懸念すべき現象を実証的に確認した研究報告を発表した。...
異なるベンダが提供する複数のAIエージェント間でのコミュニケーションやコラボレーションを実現するオープンスタンダード確立のための「Agent2Agentプロジェクト」(A2Aプロジェックト)設立を、Linux Foundationが発表しました。...
Anthropicは、AIチャット「Claude」内でAIアプリを直接構築、ホスト、共有できる機能をβ版で発表した。自然言語で指示するだけでClaudeがコーディングし、対話的にデバッグや改善が可能。完成したアプリはリンクで簡単に共有できる。...
Algomaticは、炎上対策AIエージェント「炎上対策ミマモルくん」β版の提供を開始した。炎上の兆候検知から対策までを自動化。平常時のリスク防止と、炎上発生時の被害極小化を実現する。
Google DeepMindは、ゲノム理解を深めるAI「AlphaGenome」を発表した。DNA配列の変異が遺伝子制御に与える影響を包括的かつ正確に予測することを目指す。既存モデルを上回る性能を示し、非営利の研究向けにAPIのプレビュー版が提供される。...
OWASPはAI技術の特異性に対応するための「AI Testing Guide」初期ドラフトを公開した。同ガイドは技術・業界を問わず適用可能な試験方法論を提示するもので、AIセキュリティや倫理、信頼性確保を目的としている。...
米OpenAIのサム・アルトマンCEOは、米Microsoftのサティア・ナデラCEOと7月23日に電話で会談し、将来的な協業関係について話し合ったと、24日に公開されたニューヨーク・タイムズのポッドキャスト番組で語った。...
Google DeepMindは、ターミナルから直接「Gemini 2.5 Pro」の機能を利用できるオープンソースAIエージェント「Gemini CLI」を発表した。個人利用の場合は、Googleアカウントでログインすることで、無料の「Gemini Code Assist」ライセンスが付与される。...
生成AIを活用し、顧客のメガネ購入に関する疑問や悩みに瞬時に回答・提案をするサービス「JINS AI」の実証実験の対象店舗が拡大へ。
米サンフランシスコの連邦地裁は6月23日、米新興AnthropicがAIの学習に著者の許可なく書籍を利用したことは米著作権法上合法との判断を示した。同社の行為は「フェアユース」(公正利用)に当たるとした。...