Alti blog

(実験サイトでのブログなのでサイトが落ちてたらごめんなさい)

  • 【勝手翻訳】2025年6月に注目すべき O’Reilly Radar Trends

    AIベンダーは5月の大半をAI関連の発表に費やし、ほぼすべてのカテゴリーに進出しました。しかし、注目すべきニュースはこれだけではありません。医師たちは、CRISPRを用いて、これまで治療不可能だった希少疾患を持つ赤ちゃんのDNAを修正しました。この治療が何年も効果があったかどうかは分かりませんが、赤ちゃんは順調に成長しているようです。また、あるスタートアップ企業が究極のニューラルネットワークを販売しています。これは生きた(培養された)ニューロンから作られ、ニューロンを数週間稼働させ続ける生命維持装置も備えています。これが本当に実現するかどうかはまだ分かりませんが、それでもAlphaGoにいつ勝てるようになるのか知りたいものです。

    人工知能

    • Anthropicは、Claude 4 シリーズの最初の2つのモデル 、 SonnetOpus をリリースしました。これらはハイブリッド推論モデルであり、ユーザーが「思考」に費やす時間を制御できます。ツールを並行して使用したり、(ローカルファイルへのアクセスが与えられた場合)一連のリクエストを通じて情報を記憶したりできます。
    • 新しいClaude 4モデルには驚くべき「エージェント的」特性があります。違法行為をしていると思われる場合は、法執行機関に通報 される可能性があります。バックドアなんて必要ありませんよね?私たちの知る限り、この行動はAnthropicのアライメントに関する研究でのみ確認されています。しかし、この行動を排除するようにモデルをトレーニングすれば、独自の法的結果が生じる可能性も考えられます。
    • ChatGPTは4月以降、 動作をカスタマイズするために すべての会話を追跡しています 。Simon Willisonが詳細な議論 をしています。興味深い可能性はありますが、全体としてはこれは機能ではなく問題です。
    • Stitch は、LLMを用いてユーザーインターフェースの設計と生成を支援する実験です。UIのアイデアを自然言語で記述し、ワイヤーフレームを生成・反復処理し、最終的にコードを生成したり、デザインをFigmaに貼り付けたりすることができます。
    • GoogleのDeepMindは 、Geminiで、画像生成によく使われる拡散モデルを 実験 しています。DeepMindによると、拡散モデルはより高速で、ユーザーの制御性を高めることができるとのことです。このモデルは一般公開されていませんが、ウェイティングリストに登録されています。
    • Mistralは、エージェントによるコーディングタスク向けに最適化された新しい言語モデル 「Devstral」 を発表しました 。オープンソースであり、十分な性能を備えたラップトップでも実行できるほど小型(24バイト)です。これは、単なるコード生成と実際のソフトウェア開発との間のギャップを埋めることを目指しています。
    • Meta は Llama スタートアップ プログラム を発表しました 。このプログラムでは、Llama チームからの技術サポートの提供に加え、ホストされた Llama サービスの使用料としてスタートアップに月額最大 6,000 ドルを支給します。
    • LangChainは、AIを搭載したインテリジェントエージェントを構築するためのノーコードプラットフォームであるOpen Agent Platform (OAP)を発表しました。OAPはオープンソースであり、GitHubで公開されています。オンラインで試用することも可能です。
    • Googleは、Gemmaシリーズの新しいマルチモーダルモデルであるGemma 3nを発表しました。Gemma 3nはモバイルデバイス向けに特別に設計されており、レイヤーごとの埋め込みと呼ばれる手法を用いることで、8Bのパラメータを持つモデルで必要なメモリを3GBに削減しています。
    • アラブ首長国連邦は、法律の起草にAIを活用する予定です。ブルース・シュナイアー氏は優れた議論 を投稿しています。AIを用いて法律を制定することは、新しいことでも、必ずしも反人間的なことでもない。AIは、権力の集中ではなく、人々に力を与えるために設計され得る(そして、実際に設計されてきた)のだ。
    • DeepMind はAlphaEvolveを構築しました。これは、進化的アプローチを用いて新しいアルゴリズムを作成し、既存のアルゴリズムを改良する、新しい汎用モデルです。「これはモデルなのか?それともエージェントなのか?」と疑問に思うのは私たちだけではありません。AlphaEvolveは一般公開されていません。
    • しばらくの間、xAIのGrok LLMは、ほぼすべての会話を 白人虐殺に関する会話 に変えていました。Grokが奇妙で望ましくない出力を出すのは今回が初めてではありません。「公平」というより、イーロン・マスクの執着を反映しているように見えます。
    • INTELLECT-2 は、グローバル分散システム を介してトレーニングされた 32B モデルです。グローバル分散システムとは、必要に応じてネットワークに参加したり離脱したりしながら、自発的に時間を提供するコンピューターのネットワークです。PRIME-RL は、非同期分散強化学習のトレーニング フレームワークであり、このプロセスを調整しました。INTELLECT-2 は、コードとデータを含めて オープンソース です。
    • 人間には簡単だがAIには難しいこと:LegoGPTは、テキストプロンプトに基づいてレゴ構造物を設計できます。この構造物は実際のレゴピースで組み立てられ、組み立てると自立します。あとはロボットが組み立てるだけです。
    • Microsoftは、Phi-4モデルの推論バージョンを発表しました。推論バージョン、ミニ推論バージョン、推論プラスバージョンの3種類があります。これらのモデルはいずれも比較的小規模で、推論バージョンは140億個のパラメータ、ミニ推論バージョンはわずか38億個のパラメータです。
    • GoogleはGemini 2.5 Pro Preview(I/O Edition)をリリースしました。コード生成時のパフォーマンスが向上し、YouTube動画からアプリケーションを生成できるビデオ・トゥ・コード機能も搭載されています。
    • OpenAI の命名規則 (またはその欠如) に困惑している場合は、同社が 投稿 しているすべてのモデルの役立つ概要と、各モデルが適切な場合の推奨事項を参照してください。
    • 新しい自動翻訳システムは、複数の話者を追跡し、複数の言語を同時に翻訳できます。1つのモデルが個々の話者の位置と声の特徴を追跡し、別のモデルが翻訳を行います。
    • タイトルがすべてを物語っています。「従業員をAIに置き換えた英国企業の半数以上が、その決定を後悔している」。しかし、彼らは解雇された従業員を再雇用しているのでしょうか?
    • Gemini 2.0 Flash イメージ生成が パブリック プレビューに追加されました
    • Mistralは、チャットベースのAI向けエンタープライズソリューション「Le Chat Enterprise」を 発表 しました。このチャットはオンプレミスで実行でき、企業のドキュメント、データソース、その他のツールに接続できます。
    • セマンティックキャッシング は、AIのパフォーマンス向上とコスト削減を実現する手法です。基本的には、プロンプトとレスポンスをキャッシュし、プロンプトが類似している場合はキャッシュからレスポンスを返します。
    • AnthropicはClaude Integrations を発表しました。IntegrationsはMCPを使用してClaudeを既存のアプリやサービスに接続します。サポートされている統合には、PayPalなどのコンシューマーアプリケーション、Confluenceなどのツール、Cloudflareなどのプロバイダーが含まれます。
    • GoogleはMusic AI Sandboxを アップデート し、新しいモデルと新機能を追加しました。Sunoなどの音楽ジェネレータとは異なり、Music AI Sandboxはミュージシャンが音楽クリップの編集、拡張、生成を行うためのクリエイティブツールとして設計されています。
    • 動画のディープフェイクに心拍音を再現。ディープフェイクを見分ける方法の一つとして、心拍音によって引き起こされる肌の色の微妙な変化を捉えるという手法がありました。しかし、ディープフェイクは脈拍を模倣することで、この手法を回避できるようになりました。
    • Googleは、イルカの発声を学習させた言語モデル DolphinGemma を開発しました。このモデルは一連の音の中から次に何が起こるかを予測できますが、イルカが何を言っているのかはまだ分かりません。このモデルは学習に役立つでしょう。
    • Memex は、Claude Code スタイルを踏襲したエージェンティックコーディング向けに設計された新しいアプリケーションです。Web ベースのツールとは異なり、Memex はローカルで実行されます。
    • SHADES データセットは、モデル開発者が有害なステレオタイプやその他の差別的行動を発見し、排除するのに役立つように設計されています。SHADES は多言語対応で、モデルがステレオタイプにどのように反応するかを観察することで構築されました。このデータセットは Hugging Face から入手できます。

    プログラミング

    • 開発チームの生産性に『AI』コーディングアシスタントよりも大きな影響を与える5つの退屈なこと」:タイトルがすべてを物語っている、もう一つの例です。一読の価値ありです。
    • Microsoftは、Windows Subsystem for Linux (WSL)を オープンソース化 しました。
    • 2つの新しいテキストエディターが登場しました。Windowsに独自のコマンドラインテキストエディターが登場。これはオープンソースで、Rustで書かれています。 Zed は新しい「エージェント型」エディタです。エージェント型エディタと IDE の違いは明確ではありません。
    • Jules は、Google がエージェント対応コーディング分野に参入したツールです。Gemini を使用し、「Jules がやりたくないコーディング作業をやってくれる」と謳っています。もちろん、GitHub との統合、クラウド VM でのコードテスト、テストの作成と実行、そしてその根拠の表示も行えます。
    • Terraform には MCP サーバー があります。
    • ハードウェア記述言語は難解で分かりにくく、現在使用されている高水準言語とはほとんど似ていません。Spade は、最新の高水準プログラミング言語を念頭に設計された新しい HDL で、Rust の影響を強く受けています。
    • OpenAIは、プログラミングに特化したトレーニングを受けたo3の新バージョンをベースにしたコーディングエージェント、Codexを リリース しました。Gitリポジトリからコードベースをプルし、新しいコードを書き、プルリクエストを生成し、サンドボックスを使用してテストを行うことができます。Proサブスクリプションメンバーのみが利用できます。
    • LLMはコード生成時に、過剰なコードを書き、冗長で過剰なエンジニアリングを優先する傾向があります。Fred Benenson氏がこの問題について 議論 し、いくつかの解決策を提案しています。
    • Nix は、サプライチェーンのセキュリティを大幅に向上させることができる依存関係管理ツールです。その目標は、ソフトウェアのビルドに使用されたソースの整合性を証明し、ビルドで使用されたすべてのソースとツールチェーンを追跡し、各リリースで使用されたソースをエクスポートしてサードパーティの監査を容易にすることです。
    • OpenAIは、ChatGPTのディープリサーチ機能でGitHub上のコードを調査できるようにするコネクタを 発表 しました。ディープリサーチはレガシーコードベースでどのように機能するのでしょうか?今後の展開に注目です。
    • Redisがオープンソースライセンスに 復帰 しました!Redis v8は AGPL v3 ライセンスの対象です。
    • JavaScript で 明示的なリソース管理 を行う提案があります。usingawait 宣言により、リソースがスコープ外になった際に確実に破棄されます。
    • DeepWiki は、「GitHub リポジトリを網羅した無料百科事典」です。リポジトリの概要は (どうやら) AI によって生成されたものと思われるので、リポジトリの使い方に関するチャットボットも利用できます。
    • 「コード臭」カタログ は、素晴らしく便利なツールです。ウェブサイトの見た目は少しぎこちないですが、検索機能があり、ソフトウェアのアンチパターンの詳細な説明、例、解決策が掲載されています。
    • ターミナルコマンドを覚えていない方のために:Zevは、AI(OpenAI、Google Gemini、Azure OpenAI、またはOllama)を使用して、実行したい操作を口頭で説明し、それをコマンドに変換するコマンドラインツールです。コマンドはコピー/ペーストするか、メニューから実行できます。
    • Dockerは、大規模な言語モデルをローカルで実行するための別の方法であるDocker Model Runnerを導入しました。モデルの実行はコンテナの実行と同じくらい簡単です。

    Web

    • CSS Minecraft は、ブラウザで動作する Minecraft のクローンで、HTML と CSS のみで実装されています。JavaScript は一切使用されていません。仕組み についてはこちらをご覧ください。
    • Microsoft は、ウェブサイトに MCP サポートを簡単に統合できるプロジェクトである NLWeb を発表しました。これにより、あらゆるウェブサイトが AI アプリになることができます。
    • 10Web は、eコマースサイトを構築するためのノーコード生成型 AI アプリケーションを開発しました。特徴的なのは、WordPressで実行可能なコードを生成し、その機能をプロンプトにエクスポートすることで、顧客が新しいサイトを「ホワイトラベル化」できる点です。
    • もしブラウザにエージェントAIが完全に統合されていたらどうでしょう?アドオンではなく、最初からAIを中心に構築されていたらどうでしょう?Strawberry のようなブラウザになるかもしれません。
    • Chromeの今後の機能では、デバイス上のAIを使用してテクニカルサポート詐欺を検出 します。
    • Web開発者を対象とした 調査 によると、ほとんどの開発者がAIを活用しているものの、AIによって生成されるコードは全体の25%未満です。大多数(76%)が、AIによって生成されたコードの半分以上は、使用前にリファクタリングする必要があると回答しています。

    セキュリティ

    • セキュアメッセージングアプリケーションSignalに、MicrosoftのRecallによるアプリのスクリーンショット撮影を阻止する機能が 追加 されました。これは、Windowsに組み込まれたDRMを利用してアプリごとにスクリーンショットを無効化する興味深いハックです。
    • 良性のボットやエージェントと悪意のあるボットやエージェントをどのように区別するのでしょうか?Cloudflareは暗号化技術、具体的には HTTPメッセージ署名 標準の使用を提案しています。OpenAIはすでにこれを行っています。
    • セキュリティにおける重要なトレンドとして、正規のセキュリティツールを攻撃の武器として使用する ことが挙げられます。SSH-SnakeとVShellは、レッドチームツールが武器として使用される例としてよく挙げられます。 (VShellの開発者は削除しましたが、依然として流通しています。)
    • 悪意のある Chrome拡張機能 がローカルで実行されているMCPサーバーと通信し、そこからシステムを乗っ取る可能性があります。
    • ある研究グループが、マルウェアの機能を自身に利用 というマルウェアに対する防御策を開発しました。これは、ボットネットが構築される前に排除するための有望な手法です。

    量子コンピューティング

    生物学

    • 極めて稀な遺伝性疾患を持つ赤ちゃんの治療 に、遺伝子編集が用いられました 。CRISPRを用いて、赤ちゃんのDNAの一文字を修正する薬が開発されました。これは究極の個別化医療であり、この薬は二度と使用されることはないかもしれません。
    • Cortical Cloudは 、プログラム可能な生物学的コンピュータであると主張しています。実験室で培養されたニューロン、デジタルインターフェース、そして生命維持装置が箱の中に詰まっています。いつチェスができるようになるのでしょうか?

    仮想現実と拡張現実

    • Googleグラスが復活? GoogleはWarby Parkerとの提携を発表し、AIを搭載したAndroid XR AR/VR対応グラスを開発します。このAIは(Android)スマートフォン上で動作します。

    ——–

    個人メモ

    再注目は、Claude Sonnet 4 ですね。プログラミング支援のAI利用のAPIは順次検証しながら切り替えていっています。 今回のレポートには無かったですが、日本では Claude Sonnet 4 と同時期にリリースされた、Claude Code + Max プランでの「(ほぼ)定額CLI型コーディング支援」に注目が集まっているので、こちらもキャッチアップしておきたいですね。

  • 【勝手翻訳】Inoreaderを究極の「後で読む」アプリとして使おう

    インターネットは貴重な情報の宝庫ですが、正直に言うと、時に圧倒されてしまうこともあります。企業のウェブサイト、ブログ、ニュースレター、ソーシャルメディアの投稿、ポッドキャスト、動画、長文記事など、あらゆる情報をチェックするのは、まるでフルタイムの仕事のように感じるかもしれません。そんな時に便利なのが 、後で読むツール です!

    後で読むアプリの本質は、 個人的なコンテンツ保管庫、つまり時間をかける価値のある記事を保存し、洞察を振り返り、知識ベースを構築するためのキュレーションされたスペースです。しかし、その有用性にもかかわらず、過小評価されがちです。

    後で読む優れたエクスペリエンスに何が期待できるかを詳しく見ていきましょう。

    • 利便性: コンテンツを簡単に保存して後で利用し、いつでも好きなときに利用できます。
    • 整理: タグとメモを使用して、必要なときに重要な部分をすばやく再発見します。
    • 邪魔されずに読書: すっきりしたインターフェースで、集中しているときに保存した記事を読むことができます。
    • オフライン アクセス: 飛行機や地下鉄など、インターネットがなくてもどこからでも学習を続けることができます (通常は有料機能)。

    過去1ヶ月間のベスト記事がすべて揃っていて、旅行中にいつでも読める状態を想像してみてください。あるいは、業界トレンドの完全なアーカイブが、検索と注釈付きで完全に保存されている状態を想像してみてください。あるいは、Web上で自社ブランドが言及されているすべての箇所がタグ付けされ、参照用にファイル化されている状態を想像してみてください。適切な設定さえすれば、これは夢ではなく、日々のワークフローの一部になります。そして、 Inoreaderはそれをすべて可能にします

    Inoreader が驚くほど強力な「後で読む」アプリである理由 (その他)

    Inoreader はRSSリーダーとして知られている方も多いと思いますが、実は豊富な機能を備えた「後で読む」ソリューションとしても機能します。コンテンツを探すか保存するか、もう迷う必要はありません。Inoreader を使えば、その両方をシームレスに、1か所で行うことができます。

    どこからでも何でも保存

    もう一度読みたい記事、保存しておきたいニュースレター、LinkedInの素敵な投稿など、すべて保存して後で読みましょう!Inoreaderのブラウザ拡張機能、モバイル共有、またはメールからInoreaderへ送信する機能を使えば、Web上のコンテンツをクリップできます。さらに、お手持ちのPDFやドキュメントをアップロードすれば、Inoreaderがそれらを読みやすいきれいな記事に変換してくれます。

    どこからでも何でも保存

    気を散らすことなく読む

    広告、ポップアップ、雑然としたレイアウトは一切なし。Inoreaderは、あらゆるデバイスで一貫した読書体験を提供します。保存した記事、PDF、ソーシャルメディアの投稿など、どんなコンテンツを読むときでも、インターフェースは常にすっきりと整理されているので、コンテンツが際立ち、常に一歩先を行くことができます。

    気を散らすことなく読む

    ハイライト、注釈、検索、抽出

    Inoreaderで、読書をより意識的に。重要なポイントをハイライトしたり、メモを残したり、記事に注釈を付けたりできます。さらに、InoreaderはAIツールもサポートしており、要約を抽出したり、読んだ内容に関する質問に答えたりできます。さらに、全文検索機能を使えば、考えやアイデアを見失うことはもうありません!

    ハイライト、注釈、検索、抽出
Hairaito, chūshaku, kensaku, chūshutsu

    コンテンツを自分好みに整理

    タグと「後で読む」キューを使って、コンテンツコレクションを整理しましょう。保存したアイテムは、元のコンテンツがウェブから削除されても引き続きアクセスできます。ルールを使えば、コンテンツがアカウントに届いた瞬間に自動的にタグ付け、共有、転送できます。すべてのコンテンツは検索可能で、簡単に取り出すことができ、必要な場所にすぐにアクセスできます。

    コンテンツを自分好みに整理

    デバイス間の同期とオフラインモード

    すべてのコンテンツはウェブとモバイル間で同期されます。ノートパソコンで読書リストを作成して、外出先で読み進めることができます。Wi-Fiのない場所に行く予定でも、Inoreaderのオフラインモードを使えば、どこにいても読書を続けることができます。

    デバイス間の同期とオフラインモード

    RSS + 後で読む = 両方の長所を兼ね備えた

    後で読むサービスの多くは、コンテンツを探して保存するという手間をユーザーに求めています。しかし、Inoreaderなら、 コンテンツがあなたのもとへやって来ます。お気に入りのブログやクリエイター、ニュースレターやパブリッシャー、YouTubeチャンネルなどをフォローしましょう。そして、フィードからワンクリックで最適なコンテンツを直接保存できます。最小限の労力で、よりスマートかつ迅速にライブラリを構築できる方法です。

    TL;DR: 後で読むツールとして Inoreader を使用する理由は何ですか?

    Inoreaderは、価値あるコンテンツの収集と整理に最適で、常に最新情報を入手したいヘビーユーザー、研究者、そしてプロフェッショナルにとって理想的なパートナーです。邪魔にならないクロスデバイスインターフェースと、コンテンツ検索機能と「後で読む」機能がシームレスに統合されたInoreaderは、最適なコンテンツを見つけるだけでなく、いつでもどこでもコンテンツを最大限に活用するのに役立ちます。

    ——–

    個人メモ

    Pocketの終了アナウンス後、自分は Inoreader を RSS 購読アプリとしてだけでなく、「後で読む」アプリとしても利用しています。但し、モバイルでの「後で読む」体験 (後で読み終わったよの処理) があまり良くなく、Web ブラウザでのみで使っています。

    この使い方で、公式からの情報以外で、気づいた便利ポイントを下記にメモしておきます。もうちょっと嬉しかったポイントはあった気がしますが、すぐに思い出せる範囲での共有とさせてください。

    • はてなブックマークに投稿できる
    • 「全コンテンツを読み込む」機能が便利
      • はてなブックマーク、Content more「続きはこちら」的なものを読み込んでブラウザで読める
    • 「全コンテンツを読み込む」の後に、「記事を翻訳」機能が便利
  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.19.3

    ソース: Release Release v3.19.3 · RooCodeInc/Roo-Code

    [3.19.3] – 2025-06-02

    • SSE MCP 呼び出しを修正 – transport.start オーバーライドが stdio トランスポートにのみ適用されるようにすることで、McpHub.ts の SSE 接続の問題を修正しました。これにより、SSE およびストリーミング可能な http トランスポートが元の開始メソッドを保持できるようになりました (@taylorwilsdon に感謝!)

    ———

    個人メモ

    Claude Code with Claude Max プランが、API従量課金なしで人気になっているようですね。余裕があれば少し浮気してみたいですね。

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.19.2

    ソース: Release Release v3.19.2 · RooCodeInc/Roo-Code

    [3.19.2] – 2025-06-01

    • Streamable HTTP Transport MCP サーバーのサポートを追加 (@taylorwilsdon さん、ありがとうございます!)
    • LiteLLM プロバイダーの統計情報とコスト計算にキャッシュされた読み取り/書き込み機能を追加 (@mollux さん、ありがとうございます!)
    • ユーザー編集時にファイル全体がコンテキストにダンプされないようにしました (@KJ7LNW さん、ありがとうございます!)
    • Markdown でのディレクトリリンクの処理を修正しました (@KJ7LNW さん、ありがとうございます!)
    • apply_diff REPLACE で start_line/end_line が使用されないようにしました (@KJ7LNW さん、ありがとうございます!)
    • 履歴項目の UI を TaskItem および TaskItemHeader と統合しました (@KJ7LNW さん、ありがとうございます!)
    • OpenAI 互換 API キーのラベルを修正しました
    • Virtuoso フッターの再レンダリングの問題を修正しました (@kiwina さん、ありがとうございます!)
    • ChatRowContent のレイアウトとスタイルを最適化しました (@zhangtony239 さん、ありがとうございます!)
    • apply diff でメモリを解放しました (@xyOz-dev さん、ありがとうございます!)
    • セキュリティ強化のため、Node.js を v20.19.2 にアップグレードしました(@PeterDaveHello さん、ありがとうございます!)
    • タイプミスを修正しました (@noritaka1166 さん、ありがとうございます!)

    個人メモ

    自分はこのバグフィックスのスピードについていけていないですが、いつかコントリビュートしてみたいですね。

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.19.1

    ソース: Release Release v3.19.1 · RooCodeInc/Roo-Code

    [3.19.1] – 2025-05-30

    • 複数のファイルを一度に読み込める実験的な機能 (@samhvw8 さん、ありがとうございます!)
    • SSE MCP サーバーにヘッダーを正しく渡すための修正
    • Amazon Bedrock 使用時にカスタム VPC エンドポイントのサポートを追加 (@kcwhite さん、ありがとうございます!)
    • Amazon Bedrock でのコンテキスト圧縮に関するバグを修正
    • ExecaTerminalProcess の UTF-8 エンコードを修正 (@mr-ryan-james さん、ありがとうございます!)
    • サイドバー名の設定に関するバグ修正 (@chrarnoldus さん、ありがとうございます!)
    • 機能リクエストテンプレートの CONTRIBUTING.md へのリンクを修正 (@cannuri さん、ありがとうございます!)
    • Unbound にタスクメタデータを追加し、キャッシュロジックを改善 (@pugazhendhi-m さん、ありがとうございます!)

    個人メモ

    Bedrockのサポートやバグ修正が早いですね。自分はBedrockを通してRoo Codeを使ってないのですが、Enterpriseではよく使われているんですかね。ちょっと調べてみようかなと。

  • クラウド会計ソフトの技術選定

    二社目の起業、設立前のタスク – Alti blog から一部深堀りします。2回目です。

    選択肢

    • マネーフォワードクラウド会計
    • freee会計
    • ジョブカン会計
    • 弥生会計オンライン
    • PCAクラウド会計
    • 勘定奉行クラウド
    • かんたんクラウド会計
    • HANJO 法人会計

    独自の条件

    税理士と顧問契約を締結して、税務と会計は常時相談できる状態にしようと決めていました。 また、当面バックオフィスの人員をアサインする予定はないので、自分でできる比率を高めたいと思っていました。 もちろん価格の安さも重要です。

    悩んだポイント

    安く始められて、対応を謳う税理士が多かったので、マネーフォワードとfreeeで悩みました。 マネーフォワードは、自動仕訳や帳票作成機能が強く、事業拡大時には上位プランへの移行しやすさ。 freeeは、会計知識がなくても直感的に使えるUIの良さ。

    最終ポイント

    事業拡大時には、自分が担当しなくなり、大きく変わるだろうということで、freeeを選択しました。

    メモ

    事業数/社員数/データ量が大きくならない次の年度末会計を迎えると思うので、触ってみたい!を叶えるには、次年度はマネーフォワードなど別のものに変えてみても良いかもとは思いました。 使ってみた感想も加えると、ITを中心にしたスタートアップは、freeeを選ぶで問題ないです。

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.19.0

    ソース: Release Release v3.19.0 · RooCodeInc/Roo-Code

    [3.19.0] – 2025-05-30

    • インテリジェントなコンテンツ圧縮をデフォルトで有効にし、圧縮ボタンを展開されたタスクメニューから移動します。
    • 圧縮中にコンテキストが拡大した場合は、圧縮をスキップしてエラーを表示します。
    • 整理のため、「プロンプト」タブを「モード」タブに変更し、「サポートプロンプト」を設定に移動します
    • ChutesプロバイダーにDeepSeek R1 0528モデルのサポートを追加します(@zeozeoさん、ありがとうございます!)
    • @Directoryが.rooignoreファイルを尊重しない問題を修正(@xyOz-devさん、ありがとうございます!)
    • insert_contentおよびsearch_and_replaceツールにrooignoreチェックを追加します
    • Rooをプライマリサイドバーとセカンダリサイドバー間で移動したときにメニューが壊れる問題を修正(@chrarnoldusさん、ありがとうございます!)
    • コールバックプロパティを安定化することで、ChatViewのメモリリークを解決します(@samhvw8さん、ありがとうございます!)
    • コンテンツが空の場合に空のファイルを適切に作成するようにwrite_to_fileを修正します(@Ruakijさん、ありがとうございます!)
    • タスク実行中のチャット入力のクリアを修正(@xyOz-devさん、ありがとうございます!)
    • AWSリージョンを更新し、スペインとハイデラバード
    • プッシュ前フックのPOSIXシェル互換性を改善しました(@PeterDaveHello と @chrarnoldus に感謝!)
    • ターミナルのWindows互換性のためにPAGER環境変数を更新しました(@SmartManoj に感謝!)
    • MCP設定全体に環境変数インジェクションのサポートを追加しました(@NamesMT に感謝!)
    • コードベースの検索記述を更新し、英語クエリ要件を強調しました(@ChuKhaLi に感謝!)

    個人メモ

    凄いスピードでのマイナーバージョンアップです。ちょっと今週は、vscode作業が少なかったので、追いきれていませんが、時間見つけてどんどんキャッチアップしていこうと思います。

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.18.5

    ソース: Release Release v3.18.5 · RooCodeInc/Roo-Code

    [3.18.5] – 2025-05-27

    • Requesty に思考制御機能を追加(@dtrugman さん、ありがとう!)
    • テレメトリを再度有効化
    • zh-TW 繁体字中国語ロケールを改善(@chrarnoldus さん、ありがとう)
    • LiteLLM のモデルメタデータを改善

    個人メモ

    Roo-Codeは、OpenRouter以外に、Requestry も推奨しているのですが、私個人はまだ使ったことがないので、早めに使ってみたいですね。※OpenRouterとの違いは、Requestryでは使用するモデルを指定する必要がなく、Requestry側で最適なプロバイダー・モデルを選択してくれることと、商用対応を謳っている安定感/安心感のようです。

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.18.4

    ソース: Release Release v3.18.4 · RooCodeInc/Roo-Code

    [3.18.4] – 2025-05-25

    • コードベースのインデックス設定の保存とOllamaインデックスの修正 (@daniel-lxs さん、ありがとうございます!)
    • ユーザーがapply_diffを拒否した場合のBOM処理の修正 (@avtc さん、ありがとうございます!)
    • 自動承認時に入力が誤ってクリアされる問題を修正 (@Ruakij さん、ありがとうございます!)
    • bootstrap.mjsのpnpmチェックにおける正しいspawnSyncパラメータの修正 (@ChuKhaLi さん、ありがとうございます!)
    • xAIモデルとデフォルトモデルIDの更新 (@PeterDaveHello さん、ありがとうございます!)
    • メッセージ作成時のメタデータの追加 (@dtrugman さん、ありがとうございます!)

    個人メモ

    不具合修正ですね。自分は遭遇していなかったですが、いつも迅速な対応に感謝です!

  • 【勝手翻訳+alphaXivテスト】vSIM によるセルラーネットワークにおけるデバイスと ID の分離

    ソース: [2505.15827] Decoupling the Device and Identity in Cellular Networks with vSIM Explore | alphaXiv にブログ出力する機能があったので、ブログ化して、日本語化してみます。

    はじめに

    従来のセルラーネットワークでは、SIM カードを通じて加入者 ID と物理ハードウェアが密接に結合されています。本稿では、Trusted Execution Environment (TEE) 内で SIM 機能を仮想化することにより、セルラー ID をハードウェアデバイスから分離するソフトウェアベースのソリューションである vSIM を紹介します。この研究は、セルラーネットワークにおけるプライバシーに関する懸念の高まりと、より柔軟な ID 管理を必要とする新たなユースケースに対応するものです。

    vSIM アーキテクチャの概要 図 1: ユーザー機器上の Trusted Execution Environment、リモート構成証明による安全なプロビジョニング、および 5G インフラストラクチャとの統合を示す vSIM アーキテクチャ

    vSIM アプローチは、物理 SIM カードから組み込み SIM (eSIM) および統合 SIM (iSIM) へと進化してきた現在の SIM 技術の進化とは大きく異なり、ハードウェアに結び付けられた ID を維持しています。vSIM は、セキュアなエンクレーブ内のソフトウェアで SIM 機能を完全に実装することにより、モバイルネットワーク事業者が期待するセキュリティを維持しながら、ID ローテーション、一時的な認証情報、およびデバイス間のシームレスな転送を可能にします。

    背景と現在の制限事項

    現在の SIM 技術は、vSIM が対処しようとしているいくつかの根本的な制限に直面しています。従来の SIM カード、eSIM、および iSIM はすべて、加入者 ID と特定のハードウェア間の永続的な関連性を維持しており、プライバシーの脆弱性を生み出し、新たなアプリケーションの柔軟性を制限しています。

    現在の SIM 技術のハードウェアに束縛された性質は、いくつかの課題を生み出します。

    プライバシーに関する懸念: 静的なハードウェアに束縛された ID により、さまざまなネットワークインタラクションにわたるユーザーの永続的な追跡とプロファイリングが可能になります。国際モバイル加入者識別情報 (IMSI) およびその他のハードウェアに結び付けられた識別子は一定のままであり、プライバシーを保護する ID 管理の実装を困難にしています。

    柔軟性の制限: 従来の SIM は、特定のサービスの一時的な認証情報、クラウドベースの AI アシスタントとの統合、または仮想デバイスへの電話番号のシームレスな転送など、動的な ID 管理シナリオを簡単にサポートできません。

    新たなユースケースの制限: 最新のアプリケーションでは、特定のハードウェアデバイスとは独立して動作するクラウドサービスおよび仮想アシスタントのために、セルラー接続がますます必要になっています。現在の SIM 技術は、これらのシナリオを適切にサポートできません。

    この研究は、TEE ベースのセキュリティソリューションおよびリモート構成証明プロトコルに関する既存の研究に基づいています。著者は、仮想化された ID がハードウェアベースのソリューションと同じセキュリティ特性を維持することを保証するために、vSIM とモバイルネットワーク事業者間の信頼を確立するために、Enhanced Privacy ID (EPID) を活用しています。

    vSIM アーキテクチャは、安全なソフトウェアベースの SIM 機能を提供するために連携するいくつかの主要なコンポーネントで構成されています。

    Trusted Execution Environment: vSIM のコアは TEE 内で動作し、特に RISC-V プロセッサ用の Keystone オープンソースフレームワークを使用して実装されています。このセキュアなエンクレーブは、通常のオペレーティングシステムからの分離を提供し、機密性の高い暗号化操作を保護します。

    リモートアテステーションと信頼確立: 本システムは、EPIDベースのリモートアテステーションを使用して、vSIMとモバイルネットワーク事業者のプロファイルマネージャー間の信頼を確立します。このプロセスでは、加入者クレデンシャルをプロビジョニングする前に、vSIMソフトウェアの整合性と真正性を検証します。

    セキュアプロビジョニングプロトコル: カスタムプロトコルにより、ネットワーク事業者からvSIMへの加入者プロファイルの安全な転送が可能になります。プロトコルには以下が含まれます。

    1. デバイスからの初期アテステーション要求
    2. EPIDを使用したチャレンジレスポンス認証
    3. 安全な通信チャネルの確立
    4. 加入者プロファイルデータの暗号化された転送
    5. TEE内での安全なストレージ

    5Gインフラストラクチャとの統合: vSIMは既存の5G認証メカニズムと統合されており、標準的なセルラーネットワークプロトコルとの互換性を維持しながら、ソフトウェアベースのID管理の柔軟性を提供します。

    このアーキテクチャにより、ホストオペレーティングシステムが侵害された場合でも、機密性の高い暗号鍵と加入者データがTEE内で保護されることが保証されます。この設計は、モバイルネットワーク事業者が期待するセキュリティ特性を維持しながら、ハードウェアに縛られたソリューションでは不可能な新しい機能を実現します。

    実装の詳細

    著者らは、いくつかの主要なテクノロジーとフレームワークを使用してvSIMを実装しました。

    Keystone TEEフレームワーク: この実装では、RISC-Vプロセッサ向けに設計されたオープンソースのTEEフレームワークであるKeystoneを使用しています。Keystoneは、ホストシステムへの潜在的な攻撃からvSIMの操作を保護するために必要な安全なエンクレーブ機能を提供します。

    暗号ライブラリ: チームは、以下を含む不可欠な暗号ライブラリをエンクレーブランタイムに移植しました。

    • 一般的な暗号操作のためのLibsodium
    • 効率的な対称暗号化のためのTiny AES
    • TEE環境向けに最適化されたカスタム実装

    srsRAN統合: 既存のセルラーインフラストラクチャとの互換性を示すために、研究者らはvSIMをsrsRAN(5Gネットワーク向けの一般的なソフトウェア定義無線プラットフォーム)と統合しました。この統合により、vSIMが標準的な5Gプロトコルおよび手順で動作できることが検証されます。

    エミュレーション環境: 初期実装はQEMUエミュレーション環境で実行され、特殊なハードウェアを必要とせずに開発とテストが可能になります。このアプローチは、vSIMコンセプトの迅速なプロトタイピングと評価を促進します。

    実装プロセスでは、制約のあるTEE環境で動作するように、既存の暗号ライブラリを大幅に適合させる必要がありました。著者らは、セルラー認証に必要なセキュリティ特性を維持しながら、メモリ使用量と実行効率を最適化する必要がありました。

    パフォーマンス評価

    この研究には、vSIMと従来のUSIM実装を比較した予備的なパフォーマンス測定が含まれています。評価は、ネットワークトラフィックパターンと計算オーバーヘッドに焦点を当てています。

    パフォーマンス比較 図2:従来のUSIM(左)とvSIM(右)の実装間のネットワークトラフィック比較。最小限のオーバーヘッドで同様のトラフィックパターンを示しています。

    トラフィック分析: パフォーマンスグラフは、vSIMが従来のUSIM実装と比較して最小限のオーバーヘッドしか導入しないことを示しています。インバウンドとアウトバウンドの両方のトラフィックパターンは、2つのアプローチ間でほぼ同一であり、ソフトウェアベースの実装がネットワークパフォーマンスに大きな影響を与えないことを示しています。

    計算オーバーヘッド: この論文では詳細な計算パフォーマンス指標は提供されていませんが、srsRANとの統合が成功したことは、vSIMが5G認証手順に必要なタイミング制約内で動作できることを示唆しています。

    メモリ使用量: TEEの実装では、制約のある環境のため、注意深いメモリ管理が必要です。著者らは、必要な暗号ライブラリを移植することに成功し、許容可能なメモリフットプリントを維持しました。

    予備的な結果は有望ですが、著者らは、特に実際の展開やマルチプロファイルシナリオにおいて、より包括的なパフォーマンス評価が必要であることを認めています。

    意義と将来への影響

    vSIMの研究は、セルラーネットワークとモバイルセキュリティの将来にとっていくつかの重要な意味を持ちます。

    プライバシーの強化: vSIMは、IDのローテーションとハードウェアからの分離を可能にすることで、セルラーネットワークにおけるユーザーのプライバシーを大幅に向上させることができます。ユーザーは、セルラーIDを定期的に変更したり、特定のサービスに対して一時的なIDを使用したりして、第三者がセルラーの使用パターンを追跡してプロファイリングする能力を低下させる可能性があります。

    柔軟なID管理: ソフトウェアベースのアプローチにより、ハードウェアに縛られたIDでは困難または不可能な新しいユースケースが可能になります。これには、電話番号の仮想デバイスへのシームレスな転送、クラウドベースのサービスとの統合、特定のアプリケーションまたは期間の一時的な資格情報などが含まれます。

    IoTとエッジコンピューティング: vSIMは、数千のデバイスの物理SIMカードを管理することが非現実的になる大規模なIoT環境でのID管理を簡素化できます。ソフトウェアベースのプロビジョニングと管理は、運用上のオーバーヘッドを大幅に削減できます。

    新しいビジネスモデル: モバイルネットワーク事業者は、柔軟でソフトウェア管理されたIDに基づいて、新しいサブスクリプションモデルを開発できます。これには、従量課金モデル、一時的なアクセス資格情報、またはサービス固有のIDが含まれる場合があります。

    セキュリティの進化: ソフトウェアベースのセキュリティソリューションを使用すると、ハードウェアベースのアプローチと比較して、より動的なアップデートと脆弱性パッチが可能になります。これにより、セルラーネットワーク全体のセキュリティ体制を長期にわたって改善できます。

    著者らは、FPGAベースのIoTデバイスにvSIMを実装し、マルチプロファイルサポートを開発し、より包括的なパフォーマンス評価を実施することで、研究を継続する予定です。これらの取り組みは、実際の展開におけるvSIMの実用的な実現可能性を検証し、残りの技術的な課題を特定するのに役立ちます。

    この研究は、より柔軟でプライバシーを保護するセルラーID管理に向けた重要な一歩であり、将来的にはユーザー、デバイス、およびセルラーネットワークの関係について私たちがどのように考えるかを再構築する可能性があります。

    関連する引用

    E. Brickell and J. Li, “Enhanced privacy id: A direct anonymous attestation scheme with enhanced revocation capabilities,”IEEE Transactions on Dependable and Secure Computing, vol. 9, no. 3, pp. 345–360, 2012.

    • この論文では、匿名認証と安全なプロビジョニングのためにvSIMで使用されるコア暗号プリミティブであるEnhanced Privacy ID(EPID)スキームを紹介しています。vSIMはEPIDを利用して、デバイスのIDを明らかにすることなくその信頼性を証明し、ネットワークプロバイダーとの安全な通信を可能にします。

    D. Lee, D. Kohlbrenner, S. Shinde, K. Asanovi ´c, and D. Song, “Keystone: an open framework for architecting trusted execution environments,” inProceedings of the Fifteenth European Conference on Computer Systems, ser. EuroSys ’20. New York, NY, USA: Association for Computing Machinery, 2020. [Online]. Available: https://doi.org/10.1145/3342195.3387532

    • Keystoneは、vSIMを実装および評価するために使用されるオープンソースTEEフレームワークです。この論文では、Keystoneのアーキテクチャと、vSIMのような信頼できるアプリケーションを実行するための安全な隔離された環境の作成をどのように可能にするかについて説明します。

    “3GPP TS 33.501 version 16.3.0 Release 16,” 3rd Generation Partnership Project (3GPP), Tech. Rep., 2020, accessed: 2025-01-01.

    • この3GPP標準仕様は、認証とキー管理を含む5Gネットワークのセキュリティアーキテクチャと手順を定義しています。vSIMの実装は、既存の5Gインフラストラクチャとの互換性と相互運用性を確保するために、この標準に準拠しています。