soy-software

↧

Image may be NSFW.
Clik here to view.

ChatVectorで新モデル作って評価して遊ぶヤツ、自分もやりたい

April 17, 2024, 6:39 am

最近、一部のローカルLLM勢のあいだでChatVectorで遊ぶのが流行っている。ChatVectorとは何か？というとこちらの論文で発表された技術だ。 [2310.04799] Chat Vector: A Simple Approach to Equip LLMs with Instruction Following and Model Alignment in New Languages...

View Article

Image may be NSFW.
Clik here to view.

Command R+はどこまで量子化するとアホになってしまうのか？

April 21, 2024, 11:40 am

今回は、ローカルで動かせるCommand R+の量子化モデルを色々使ってそれぞれにElyzaTasksベンチマークを解かせるという事をやる。...

View Article

Image may be NSFW.
Clik here to view.

GPUが1枚でもローカルで高速にLLM評価を回したい！

April 23, 2024, 5:17 am

前回の記事の続きです。 Command R+はどこまで量子化するとアホになってしまうのか？前回の記事で、Command R+（CR+）のようなモデルはまあ4bit程度までは量子化しても実用的に問題なさそうだという事が分かった。...

View Article

Image may be NSFW.
Clik here to view.

Mergekit-Evolve登場！進化的アルゴリズムで手元のLLMを最強進化させよう！

April 26, 2024, 10:28 pm

前回の記事では、GPUが１枚だけの環境でなるべく高速にローカルでElyzaTasks100の評価を回す方法を示した。 GPUが1枚でもローカルで高速にLLM評価を回したい！だから次はこれ使って進化的アルゴリズムでモデルを進化させてみたいね！という話だったのだが、そんな時、まさに渡りに船のグッドタイミングでMergekit-Evolveが登場した！...

View Article

Image may be NSFW.
Clik here to view.

VRAM6GBしかないノートPCでもMergekit-Evolveで進化的マージを回したい

May 1, 2024, 3:28 am

前回、Mergekit-Evolveによる進化的マージについて紹介した。 Mergekit-Evolve登場！進化的アルゴリズムで手元のLLMを最強進化させよう！私の記事では評価モデルとしてローカルのLlama3-70Bを使ったのだが、その後、布留川さんが評価にGeminiのAPIを使うという画期的なアイデアを実装してくれた。 Google Colab で mergekit-evolve による...

View Article

Image may be NSFW.
Clik here to view.

最近ローカルLLMがアツいらしい

May 20, 2024, 1:13 am

最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。...

View Article

Image may be NSFW.
Clik here to view.

最近の7B小型日本語LLMはエージェントになれるのか？

May 31, 2024, 10:48 pm

あれから進化的マージの試行錯誤を繰り返していたが、ついに相当性能が高そうなモデルが生まれた。 Umievo-itr012-Gleipnir-7Bである。 umiyuki/Umievo-itr012-Gleipnir-7B · Hugging Face ElyzaTasks100の平均スコアは3.91に達して、ついにGPT-3.5Turboのスコア（3.88）を上回ってしまった。...

View Article

Image may be NSFW.
Clik here to view.

ShaberiベンチマークでLLMを評価する

June 12, 2024, 5:12 am

最近はますます小型LLMの開発競争が熾烈さを増している。何故か？というと今まで散々書いてきた通り、チャットベクターや進化的マージでLLMの性能が引き出せることが分かったし、それらの操作には計算資源はほとんど不要だから、個人でも参入できると分かったからだ。 Twitter上の目ぼしいメンツはみんな進化的マージに着手してるまである。当然だろう。敢えてやらない理由が見つからない。...

View Article

Image may be NSFW.
Clik here to view.

ゲーム思考

July 29, 2024, 5:22 am

最近、ある考え方について考えている。この考え方に”ゲーム思考”という名前を付けてみた。社会ゲームとは何か？...

View Article

Image may be NSFW.
Clik here to view.

LLMを評価するためのベンチマーク、Shikaku3（ビジョン性能）とJiyuu（無修正性能）を整備

March 25, 2025, 2:55 am

...

View Article