SIMD - PukiWiki

[ 編集 | 凍結 | 新規 | 差分 | 添付 ]

検索

メモ

僕の経験

生活

常識

金銭

旅行

健康

美術

学業

国

言語

エンジニアリング

統合システム

ハード

ソフト

管理

制御

趣味

嗜好品

鑑賞

習得

情報発信

デザイン

情報発信

文章

ビジネス

事業

会計

商談

投資

遂行

情報・知的財産

研究

研究基本

研究課題発見

サーベイ

研究方法

研究表現

論文
発表

研究発表参加

質問

研究哲学

研究室運営

最新の70件

2025-07-14

SQL

2025-07-06

生活

2025-07-05

レシピ

2025-07-04

Ubuntu

2025-06-29

2025-06-23

料理

2025-06-11

プレゼント

2025-06-05

詐欺

2025-06-02

ふるさと納税

2025-06-01

健康

2025-05-27

リモートデスクトップ

2025-05-23

酒

2025-05-20

三目並べ

2025-05-19

Chrome

2025-05-12

韓国語

2025-05-11

GitHub

2025-05-10

洋服

2025-05-08

Google Sheets

2025-04-27

量子コンピュータ

2025-04-19

MySQL

2025-04-11

トラブルシューティング

2025-04-10

ネットワーク

2025-03-16

FrontPage

2025-03-04

ラストウォー

2025-03-01

Steam

2025-02-26

セキュリティ

2025-02-21

パソコン

2025-01-18

Azure

2025-01-02

哲学

2024-12-25

歯医者

2024-12-16

名刺

2024-10-25

自転車

2024-09-30

メルカリ

2024-09-23

IPA

2024-09-22

Anki

2024-08-28

ダイエット

2024-08-14

魅力的な話し方

2024-08-03

妊娠

2024-07-24

育児

2024-07-01

LLM
CSV

2024-06-12

Cookie+Clicker+Mobile

2024-05-25

ぷよぷよ

2024-04-30

英語
IELTS

2024-04-09

RecentDeleted

2024-04-01

株

2024-03-11

泥酔ローグと増魔の洞窟

2024-03-09

数学

2024-03-07

非厳密アルゴリズム

2024-03-02

p5.js

2024-02-26

Generative+AI

2024-02-24

MenuBar

2024-02-21

PostgreSQL

2024-01-29

うなぎを食べない教

2024-01-24

2024-01-23

投資

2024-01-10

コマンド

2024-01-04

Python

2023-12-21

2023-10-16

Electronic+Diversity+Visa+Program

2023-10-10

写真

2023-09-10

眼科

概要 †

定数倍高速化の闇魔法

下位ページ †

Intel MKL

コーディングの前に †

最適化-O3は基本的に同じことをやっている
- でも人でやらないと、ifを減らすみたいなことはできないからこれをやる必要がある
「いかに load や set を減らせるか」が早くなるかどうかのポイント
[[MIMDはマルチスレッド>http://www.slideshare.net/FukushimaNorishige/ssii-33751285 ]](47ページ)、GPGPUもSIMD。ここではCPUのSIMDについて。
- 化学系ではSIMD + Intel MKLで殴ってる
- 一部の需要はあるしそういうとこではかなり意味があるがSIMDやるくらいならGPUに任せる、CPUは小さいMIMD（スレッド）をたくさんつくるとかのが綺麗そう。
- 確かに並立化効率がx2とかx4くらいだと、GPGPUほどの並列が組めなくて、レイテンシばかり増えてくるみたいな感じ
ライブラリ関数一覧

ハードウェア †

サイズはたしか端子の大きさが電源供給の点である程度必要で律速

例 †

SSE †

SSE=SIMD - Simple Instruction Multiple Data
SSE (Streaming SIMD Extensions) と呼ばれる拡張命令セット。AVXがその後継
- 128bitレジスタが用意されてる。
- SIMD組み込み関数(SIMD Intrinsic)を使うには

#include <xmmintrin.h>
#include <emmintrin.h>

理論的なもの
体系だてたもの
- Atcoderのものもはいってる。複数の問題で解説。
コンパイラが自動ベクトル化しやすいようにプログラムを書き換える方法
- TC D1Hなどで、ただ自動ベクトル化しやすいようにしただけで8倍速になる！！
ベクトル内積の例
くわしい
初心者向けの講座。条件式の削除などあり、面白そう
- http://cell.fixstars.com/ps3linux/index.php/%E7%AC%AC2%E7%AB%A0_SIMD%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0%E3%81%AE%E5%9F%BA%E7%A4%8E

Notが無いのでandnotでやんないといけない http://d.hatena.ne.jp/LS3600/20110910#p1 yukicoderはSSE4.1まで使える　http://rsujskf.s602.xrea.com/?memos_sse&datdate=1432985305 if文のSSEはselを使えばよいはず。https://www.kernel.org/pub/linux/kernel/people/geoff/cell/ps3-linux-docs/CellProgrammingTutorial/BasicsOfSIMDProgramming.html（両方の条件で計算しておいて、bitmaskごとにどちらを選ぶかを選択）

SIMDのバージョン †

SSE2（g++デフォルト）
SSE3
SSE4.1
SSE4.2（この辺までは、インラインアセンブリを使えば実は使える）
AVX

Last-modified: 2017-05-24 (水) 15:54:16 (2974d)