Alti blog

(実験サイトでのブログなのでサイトが落ちてたらごめんなさい)

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.22.2

    ソース: Release Release v3.22.2 · RooCodeInc/Roo-Code

    [3.22.2] – 2025-06-27

    • 修正: CodeBlock コンポーネントの XSS 脆弱性を修正しました (@KJ7LNW さん、ありがとうございます!)
    • コンテキストにコンテンツを追加する際のターミナルキーボードショートカットエラーを修正しました (@MuriloFP さん、ありがとうございます!)
    • StandardTooltip ラッパーの競合によりチェックポイントポップオーバーが開かない問題を修正しました (@daniel-lxs さん、ありがとうございます!)
    • 修正(i18n): Gemini CLI のエラー翻訳パスを修正しました (@daniel-lxs さん、ありがとうございます!)
    • Code Index (Qdrant) で設定変更時にサービスが再作成される問題を修正しました (@catrielmuller さん、ありがとうございます!)
  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.22.1

    ソース: Release Release v3.22.1 · RooCodeInc/Roo-Code

    [3.22.1] – 2025-06-26

    • Gemini CLI プロバイダーを追加 (Cline さん、ありがとう!)
    • 未定義の mcp コマンドを修正 (@qdaxb さん、ありがとう!)
    • OpenRouter BYOK のコスト計算に upstream_inference_cost を使用し、キャッシュされたトークン数を表示するようにしました (@chrarnoldus さん、ありがとう!)
    • Groq の qwen/qwen3-32b モデルの maxTokens 値を更新 (@KanTakahiro さん、ありがとう!)
    • ツールチップの遅延を 300ms に標準化
  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.22.0

    ソース: Release Release v3.22.0 · RooCodeInc/Roo-Code

    [3.22.0] – 2025-06-25

    • ワンクリックタスク共有機能を追加
    • グローバル .roo ディレクトリからのルール読み込みをサポート(@samhvw8 さん、ありがとう!)
    • モードセレクターの改善(@brunobergher さん、ありがとう!)
    • タスク履歴の破損を防ぐため、すべての JSON ファイル書き込みに safeWriteJson を使用(@KJ7LNW さん、ありがとう!)
    • モード編集時の YAML エラー処理を改善
    • importSettings を VSCode コマンドとして登録(@shivamd1810 さん、ありがとう!)
    • 空のタスクにデフォルトのタスク名を追加(@daniel-lxs さん、ありがとう!)
    • 不要なファイル読み取りを回避するため、翻訳ワークフローを改善(@KJ7LNW さん、ありがとう!)
    • write_to_file が改行のみのコンテンツと空のコンテンツを処理できるように(@Githubguy132010 さん、ありがとう!)
    • CodeBlock コンポーネントにおける複数のメモリリークを修正(@kiwina さん、ありがとう!)
    • メモリクリーンアップ(@xyOz-dev さん、ありがとう!)
    • HTTPS URL のコードインデックスにおけるポート処理のバグを修正(@benashby さん、ありがとうございます!)
    • スロットリングおよびストリーミングコンテキストにおける Bedrock エラー処理を改善しました
    • 長い Claude コードメッセージを処理できるようにしました (@daniel-lxs さん、ありがとうございます!)
    • Claude コードのキャッシュと画像アップロードを修正しました
    • Claude コードプロバイダーの推論予算 UI コントロールを無効化しました
    • Azure OpenAI 推論モデルの温度パラメーターを削除しました (@ExactDoug さん、ありがとうございます!)
    • コマンドのインポート/エクスポートを許可しました (@catrielmuller さん、ありがとうございます!
    • クイックフィックスのコンテキストアクションを無効にする VS Code 設定を追加しました (@OlegOAndreev さん、ありがとうございます!)
  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.21.5

    ソース: Release Release v3.21.5 · RooCodeInc/Roo-Code

    [3.21.5] – 2025-06-23

    • QdrantClient 初期化時の Qdrant URL プレフィックス処理を修正しました(@CW-B-W さん、ありがとうございます!)
    • LM Studio モデル検出機能を改善し、ダウンロードしたすべてのモデルが表示されるようにしました(@daniel-lxs さん、ありがとうございます!)
    • Claude Code プロバイダーの JSON 解析と推論ブロックの表示に関する問題を解決しました

    ———

    個人メモ

    最近 Qdrant 関連のアップデートが増えていますね。ローカルで動くベクターデータベースですなので、自分も有効活用していきたいと思います。

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.21.4

    ソース: Release Release v3.21.4 · RooCodeInc/Roo-Code

    [3.21.4] – 2025-06-23

    • 複数適用の差分で開始行が機能しない問題を修正しました (@samhvw8 さん、ありがとうございます!)
    • Markdown プレビューの関連付けに関する差分エディターの問題を解決しました (@daniel-lxs さん、ありがとうございます!)
    • Qdrant の HTTPS URL における URL ポート処理のバグを修正しました (@benashby さん、ありがとうございます!)
    • 未使用の Ollama スキーマプロパティをオプションとしてマークしました (@daniel-lxs さん、ありがとうございます!)
    • リモートのフォールバックとして使用する場合は、ローカルブラウザを閉じます (@markijbema さん、ありがとうございます!)
    • ローカル CLI 統合用の Claude Code プロバイダーを追加しました (@BarreiroT さん、ありがとうございます!)

    ———

    個人メモ

    ローカル CLI 統合用の Claude Code プロバイダーを追加しました って何だろう。ちょっと深堀りしてみないとですね。

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.21.3

    ソース: Release Release v3.21.3 · RooCodeInc/Roo-Code

    [3.21.3] – 2025-06-21

    • プロファイル固有のコンテキスト圧縮しきい値を追加(@SannidhyaSah さん、ありがとう!)
    • lmstudio と ollama のコンテキスト長を修正(@thecolorblue さん、ありがとう!)
    • MCP ツールの目のアイコンの状態を解決し、チャットコンテキストで非表示に(@daniel-lxs さん、ありがとう!)

    ———

    個人メモ

    6月納品の案件の目処が立ったので、今週は Vibe Coding をやってくぞーって思ってます!

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.21.2

    ソース: Release Release v3.21.2 · RooCodeInc/Roo-Code

    [3.21.2] – 2025-06-20

    • チャットウィンドウにLaTeX数式レンダリングを追加
    • MCPサーバーツールをプロンプトから除外するトグルを追加(@Rexarriorさん、ありがとう!)
    • list_filesツールにシンボリックリンクのサポートを追加
    • マーケットプレイスで入力後に空白になる問題を修正
    • @メンションによる「フォルダを追加」機能での再帰ディレクトリスキャンを修正(@village-wayさん、ありがとう!)
    • API再試行中にキャンセルすると、サブタスクが表示されない問題を修正
    • Gemini 2.5 Flashの価格を修正(@daniel-lxsさん、ありがとう!)
    • マーケットプレイスのタイムアウトの問題を修正し、インストール済みのMCPを表示(@daniel-lxsさん、ありがとう!)
    • オンボーディングの調整を行い、モードを強調表示(@brunobergherさん、ありがとう!)
    • 「Boomerang Tasks」を「Task Orchestration」に改名してわかりやすくする
    • attempt_completionからコマンド実行を削除
    • 句読点が続くリンクのマークダウンを修正(@xyOz-devさん、ありがとう!)

    ———

    個人メモ

    「Task Orchestration」に改名 は良いネーミングですね。もっと積極的に使って、ユースケースを公開ですね。

  • 【勝手翻訳】[RooVetGit/Roo-Code] Release v3.21.1

    ソース: Release Release v3.21.1 · RooCodeInc/Roo-Code

    [3.21.1] – 2025-06-19

    • コードベースのインデックス作成が正しく機能しない原因となっていたツリーシッターの問題を修正しました
    • コードベース検索埋め込みのエラー処理を改善しました
    • Windows での Node バージョンマネージャーを使用した MCP サーバー実行の問題を解決しました
    • 「MCP サーバーの作成を有効にする」をデフォルトで false に設定しました
    • サブタスク開始時にレート制限を正しく設定しました (@olweraltuve さん、ありがとうございます!)

    ———

    個人メモ

    コードベースのインデックス作成の機構をちゃんと調べたことがないので調べてみたいですね。

  • macOS を Tahoe 26.0 Beta にアップデートしてみた

    macOS を Tahoe 26.0 Beta にアップデートしてみた

    WWDC 関連のニュースで、クリップボード履歴?というワードが聞こえたので、「使ってみたい!」と思い、ベータバージョンですがアップデートしてみました。

    アイキャッチ画像にもスクリーンショットを入れましたが、まず色味が変わりました。なぜかウィジェットも勝手に配置されました。 Finder アイコンはなぜか左右の配色も逆転。。。

    そして、クリップボード履歴に期待して動作を確認してみましたが、Spotlight が起動/フォーカスされている時にクリップボード履歴が使えるだけで、OS グローバルで使える訳ではなく期待していたものとは違いました。

    また、まだそこまで様々なユースケースやアプリケーションの動作確認はしていませんが、現時点でクリティカルなのは、Dropbox のクライアントアプリが起動できないようです。 MacFuse 関連では毎回のことっぽいことが 海外サイト で見つかったので、OSのバージョンを戻すか、対応を待つのが良いかもです。

  • 【勝手翻訳】畳み込みニューラルネットワークにおけるクラス不均衡問題の体系的な研究

    ソース: A systematic study of the class imbalance problem in convolutional neural networks | alphaXiv

    ディープラーニングにおけるクラス不均衡の理解

    クラス不均衡は、機械学習において一部のクラスが他のクラスよりも著しく多くの学習例を持つ場合に生じる、広範な課題です。この問題は従来の機械学習において広範に研究されてきましたが、畳み込みニューラルネットワーク(CNN)への影響については、体系的な経験的研究を通じてほとんど未探索のままでした。Buda、Maki、Mazurowskiによる本研究は、クラス不均衡がCNNに与える影響を包括的に調査し、様々な緩和戦略を評価することで、この重要なギャップに対処しています。

    クラス不均衡の例 図1:異なる種類のクラス不均衡の例。(a) ステップ不均衡(ρ=10, μ=0.5)。半分のクラスがマイノリティであり、例の数が10分の1少ない。(b) ステップ不均衡(ρ=2, μ=0.9)。ほとんどのクラスがマイノリティである。(c) 線形不均衡(ρ=10)。クラスサイズが線形に変化する。

    この研究の動機は、バランスの取れたデータセットが稀である現実世界のアプリケーションにあります。医用画像処理、不正検出、異常検出はすべて、特定のクラス(疾患、不正取引、異常)が正常なケースよりもはるかに低い頻度で発生するシナリオを提示します。このようなシナリオの普及にもかかわらず、ディープラーニングの実務家はクラス不均衡に対処する際、主に直感と逸話的証拠に頼ってきました。最も一般的には、その有効性を体系的に検証することなく、オーバーサンプリング技術を適用しています。

    実験フレームワークと方法論

    著者らは、複雑さの異なるレベルでクラス不均衡の影響を体系的に評価するための厳密な実験フレームワークを設計しました。彼らは、実際によく遭遇する2種類の主要な不均衡を定義しました。

    ステップ不均衡は、マイノリティクラスとマジョリティクラスの間に明確な区別を作り出し、μ(マイノリティクラスの割合)とρ(マジョリティクラスとマイノリティクラスのサイズの比率)という2つのパラメータによって特徴付けられます。このタイプは、特定のカテゴリが本質的に稀であるシナリオをシミュレートします。

    線形不均衡は、最小から最大まで線形勾配に沿ってクラスサイズを分布させ、最大クラスと最小クラスの比率を表す単一のパラメータρによって特徴付けられます。これは、クラス頻度がより緩やかな分布に従うデータセットを反映しています。

    この研究では、複雑さが増す3つのベンチマークデータセットを使用しました。

    • MNIST: 現代的なLeNet-5アーキテクチャを使用した、シンプルな28×28グレースケール手書き数字
    • CIFAR-10: All-CNNアーキテクチャを使用した、より複雑な32×32カラーの自然物
    • ImageNet: ResNet-10アーキテクチャを使用した、1000クラスの大規模データセット

    この進行により、研究者はタスクの複雑さがクラス不均衡の影響とどのように相互作用するかを理解し、異なるドメインとスケールに適用可能な洞察を提供できます。

    クラス不均衡に対処する方法

    この研究では、クラス不均衡を処理するためによく使用される7つの異なるアプローチを体系的に比較しました。

    1. ランダムマイノリティオーバーサンプリング: マイノリティクラスのランダムに選択されたサンプルを、マジョリティクラスのサイズに合うまで複製する
    2. ランダムマジョリティアンダーサンプリング: マジョリティクラスからランダムなサンプルを削除し、マイノリティクラスの数に合わせる
    3. 二段階学習(オーバーサンプリング): オーバーサンプリングされたデータで事前学習を行い、その後、元の不均衡なデータで出力層を微調整する
    4. 二段階学習(アンダーサンプリング): 同様のアプローチだが、アンダーサンプリングされた事前学習データを使用する
    5. しきい値調整: 推論時に事前クラス確率を使用して決定しきい値を調整する
    6. オーバーサンプリング + しきい値調整: 学習中のオーバーサンプリングとしきい値調整を組み合わせる
    7. アンダーサンプリング + しきい値調整: アンダーサンプリングとしきい値調整を組み合わせる

    評価では、主要な指標としてマルチクラスROC曲線下面積(AUC)が用いられました。これは、クラスの出現頻度によって偏りを受けない、分類器の判別能力を示すしきい値に依存しない測定値であるため選ばれました。この指標の選択は、異なる決定境界を移動させる可能性のある手法を公平に比較するために極めて重要です。

    主要な発見と性能分析

    Performance comparison across datasets 図2:MNIST(上段)とCIFAR-10(下段)における異なる不均衡シナリオでのマルチクラスROC AUC性能比較。オーバーサンプリングは、少数クラスの数と不均衡比が変化しても、他の手法を一貫して上回っています。

    この研究の最も重要な発見は、オーバーサンプリングが事実上すべてのテストされたシナリオで一貫して優れた手法として浮上したことです。この結果は、異なるデータセット、不均衡の種類、および深刻度レベルにわたって保持されます。重要なのは、最適な戦略が、部分的なオーバーサンプリングを適用するのではなく、少数クラスが多数クラスのサイズと完全に一致するまでオーバーサンプリングすることです。

    タスクの複雑さの影響:この研究は、より複雑なタスクがクラス不均衡によって不均衡に影響を受けることを明らかにしています。MNISTは中程度の不均衡レベルに対して回復力を示しましたが、CIFAR-10とImageNetははるかに急峻な性能劣化を示しました。この発見は、実世界のアプリケーションにとって重要な意味を持ち、複雑なタスクに展開される洗練された深層学習モデルが、クラス分布により注意を払う必要があることを示唆しています。

    アンダーサンプリングの性能:オーバーサンプリングの成功とは対照的に、アンダーサンプリングは一般的に性能が悪く、何もしないよりも悪い場合がよくありました。これは、深層学習が大量の訓練データを必要とするという根本的な要件と一致しています。多数クラスから潜在的に価値のある情報を破棄することにより、アンダーサンプリングはCNN訓練のデータ消費量の多い性質を損ないます。

    Linear imbalance comparison 図3:MNISTとCIFAR-10における線形不均衡の性能比較。このより緩やかな不均衡シナリオでも、オーバーサンプリングは特に不均衡の深刻度が増すにつれて、優れた性能を維持しています。

    二段階訓練:このより洗練されたアプローチは、リサンプリングされたデータでの初期訓練と、元のデータでのファインチューニングを含み、ベースラインと単一フェーズのサンプリング手法の中間の性能を示しました。しかし、計算の複雑さを増す一方で、直接的なオーバーサンプリングに対する明確な利点を提供できませんでした。

    過学習の懸念への対応

    この研究の最も重要な貢献の一つは、オーバーサンプリングがCNNに過学習を引き起こすという懸念に決定的に対処したことです。古典的な機械学習の文献では、特に決定木のようなモデルで、過学習の可能性からオーバーサンプリングを避けるよう警告されることがよくあります。

    Training dynamics analysis 図4:CIFAR-10の訓練とテストの精度曲線。オーバーサンプリングがCNNに過学習を引き起こさないことを示しています。訓練精度とテスト精度の間のギャップは、ベースライン訓練と比較して、オーバーサンプリングによって安定するか、あるいは減少します。

    著者らは、訓練のダイナミクスの慎重な分析を通じて、オーバーサンプリングがCNNに過学習を引き起こさないことを実証しています。訓練性能とテスト性能の間のギャップは、オーバーサンプリングによって安定するか、あるいは改善され、古典的な機械学習の直感に反しています。この発見は、深層学習アプリケーションにおけるオーバーサンプリングの採用に対する大きな障壁を取り除きます。

    実用的な示唆と推奨事項

    この研究は、実践者に対して明確で実用的なガイダンスを提供します。

    $\text{推奨戦略} = \text{完全なオーバーサンプリング} + \text{しきい値処理(精度が重要なら)}$

    ROC AUC最適化の場合: クラスの不均衡を完全に解消するために、少数派のランダムなオーバーサンプリングを適用します。このアプローチは、多様なシナリオにおいて一貫して最高の識別性能を提供します。

    精度最適化の場合: オーバーサンプリングと、事前クラス確率を用いたしきい値調整を組み合わせます。ROC AUCは変化しませんが、この組み合わせにより、全体的な分類精度が大幅に向上します。

    Accuracy improvements with thresholding 図5:異なるサンプリング手法としきい値処理の組み合わせによって達成される精度向上。オーバーサンプリングとしきい値処理の組み合わせは、様々な不均衡シナリオにおいて最高の精度性能を提供します。

    実装の簡便さ: ランダムオーバーサンプリングは、その簡潔さにもかかわらず効果が高く、実世界での導入に非常に実用的です。SMOTEや生成アプローチなどのより洗練された手法は追加の利点を提供するかもしれませんが、実質的な改善のためには必須ではありません。

    より広範な影響と将来の方向性

    この体系的な研究は、深層学習におけるクラス不均衡処理の重要な基礎を確立します。この発見は、不均衡データが例外ではなく規範である多数の応用分野に即座に影響を与えます。

    医療応用: 放射線医学や医用画像処理において、主に正常な症例の中で稀な疾患を検出する必要がある場合、オーバーサンプリングの実証された有効性は、その使用を阻害する可能性のある過学習の懸念なしに、診断感度を向上させる信頼できる戦略を提供します。

    産業応用: 品質管理、不正検出、異常検出システムは、モデルの汎化能力を損なうのではなく強化することを知って、自信を持ってオーバーサンプリング戦略を採用できます。

    研究方法論: 本研究は、適切な評価指標の重要性を強調し、不均衡なシナリオにおいて精度単独がいかに誤解を招くかを示し、より信頼性の高い性能指標としてROC AUCを提唱しています。

    本研究は、今後の調査への道も開きます。オーバーサンプリングは非常に効果的であることが証明されましたが、より洗練されたデータ拡張技術、特にディープネットワーク用に設計されたコストセンシティブ学習アプローチ、および不均衡を本質的に処理するアーキテクチャの変更を探求することは、有望な方向性として残っています。さらに、クラス不均衡と、ドメインシフト、限られたラベル、敵対的頑健性といった他の一般的な深層学習の課題との相互作用は、さらなる体系的な調査を保証します。

    明確な経験的証拠と実践的なガイダンスを提供することで、本研究は、多くの実世界アプリケーションを特徴づける不均衡データシナリオにおいて、CNNのより信頼性が高く効果的な展開を可能にします。