LLM のバックアップ(No.1) - PukiWiki

検索

メモ

僕の経験

生活

常識

金銭

旅行

健康

美術

学業

国

言語

エンジニアリング

統合システム

ハード

ソフト

管理

制御

趣味

嗜好品

鑑賞

習得

情報発信

デザイン

情報発信

文章

ビジネス

事業

会計

商談

投資

遂行

情報・知的財産

研究

研究基本

研究課題発見

サーベイ

研究方法

研究表現

論文
発表

研究発表参加

質問

研究哲学

研究室運営

最新の70件

2025-11-03

レシピ

2025-11-01

酒
健康

2025-10-31

生活

2025-10-27

人生

2025-10-26

2025-10-25

2025-10-24

2025-10-18

Google+Photos

2025-10-17

2025-10-04

Mac
電池

2025-10-03

2025-09-20

Oracle

2025-09-14

日本語

2025-09-13

Gemini
PMP

2025-08-30

jq

2025-08-27

コマンド

2025-07-30

Google Sheets

2025-07-25

2025-07-14

SQL

2025-07-04

Ubuntu

2025-06-29

2025-06-11

プレゼント

2025-06-05

詐欺

2025-06-02

ふるさと納税

2025-05-27

リモートデスクトップ

2025-05-20

三目並べ

2025-05-19

Chrome

2025-05-12

韓国語

2025-05-11

GitHub

2025-04-27

量子コンピュータ

2025-04-19

MySQL

2025-04-10

ネットワーク

2025-03-04

ラストウォー

バックアップ一覧
ソースを表示
LLM は削除されています。
- 1 (2024-06-23 (日) 08:02:01)
- 2 (2024-06-23 (日) 08:35:35)
- 3 (2024-07-01 (月) 13:59:18)

概要 †

流行りだよね

Ubuntu 20.04 †

ローカルで LLM をする動かす方法

インストール（GPU なし）

apt -y install nvidia-cudnn python3-pip python3-dev python3-venv gcc g++ cmake jq
pip3 install llama-cpp-python[server]
wget https://huggingface.co/TheBloke/Llama-2-13B-chat-GGUF/resolve/main/llama-2-13b-chat.Q4_K_M.gguf

サーバ立ち上げ

python3 -m llama_cpp.server --model ./llama-2-13b-chat.Q4_K_M.gguf --n_gpu_layers -1 --host 0.0.0.0 --port 8000 &
http://localhost:8000/docs

コマンド（出力には 2 分以上かかる）

curl -s -XPOST -H 'Content-Type: application/json' localhost:8000/v1/chat/completions -d '{"messages": [{"role": "user", "content": "Tell me about Hiroshima city, Japan."}]}' | jq | sed -e 's/\\n/\n/g'