HPC/並列プログラミングポータルでは、HPC(High Performance Computing)プログラミングや並列プログラミングに関する情報を集積・発信しています。 |
[記事一覧を見る]
インテルが開発ツール製品ラインを一新、より高いパフォーマンスを求める開発者に向けた開発ツール「インテル Parallel Studio XE 2011」をリリースした。コンパイラやデバッガ、プロファイラを含む総合開発パッケージであり、WindowsおよびLinux版が用意されている。
インテル C++ Composer XEには、強力な最適化機能を備えるコンパイラが含まれている。インテルCPUが備えるSSEやAVXといった機能を効率的に利用するコードや、マルチコアによる並列処理を行うコードを自動的に生成できるのが特徴だ。本記事ではインテル C++ Composer XEが持つさまざまな最適化機能を紹介するとともに、コンパイラが出力するアセンブラコードをチェックしてその効果を探っていく。
ソフトウェア開発において、テストやデバッグは設計やコーディング以上に重要な工程である。これらの工程において、プログラム中の問題検出やパフォーマンス解析に役立つ強力なツールがインテル Parallel Studio XEに含まれる「インテル VTune Amplifier XE」や「インテル Inspector XE」だ。本記事ではこれらのツールを用いてmemcachedのチューニングを行い、高速化を試みた事例を紹介する。
Moblinはさざまな機器での利用を視野に入れて設計・開発されたプラットフォームであり、中核となる「Moblin Core」と呼ばれるコンポーネント群をベースに機器やアプリケーション独自のUIを構築できるようになっている。Moblinアプリケーションを開発するに当たって、まずはMoblinプラットフォームの概要と、Moblin Core向けの開発環境構築方法について解説しておこう。
Moblinアプリケーション開発は実機と開発環境が異なるクロスコンパイル環境で行うため、通常のLinux向けアプリケーションとは若干開発手順が異なる。本記事ではIDEを使ったMoblinアプリケーション開発の基本的手順と、インテル コンパイラーを利用してMoblinアプリケーションをコンパイルするための設定方法などを紹介する。
ネットブックやMIDといったリソースの少ないマシンで動作するアプリケーションをデバッグする場合、実行環境とは異なるマシンでアプリケーションの動作状況をモニタリングするリモートデバッグが有用だ。本記事ではEclipseやgdbserver、そして「インテル アプリケーション・デバッガー」といったツールを使用してリモートデバッグを行う基本的な手順を紹介する。また、アプリケーションのパフォーマンスを調査するプロファイリングをリモート環境で行う方法も解説する。
Windows 7の導入にあたり、いままで使っていたアプリケーションや開発ツールが新しい環境でも正しく動作するか気になっているユーザーも多いだろう。そこで本記事では、Windows 7環境でのインテル コンパイラーやVisual Studioといった開発ツールの動作確認や、Windows 7向けのWindows SDKの導入、そしてパフォーマンス検証など、Windows 7上での開発環境の利用について紹介する。
インテル コンパイラーはVisual C++やGCCといったコンパイラと高い互換性を備えている。そのため、多くのソフトウェアではほとんど修正を行うこと無しにインテル コンパイラーでのコンパイルが可能であるが、ソフトウェアによってはコンパイル時の設定にコツがあったり、ソースコードの修正等が必要な場合もある。本記事では、さまざまなオープンソースソフトウェアをインテル コンパイラーでコンパイルし、そのコンパイル方法や注意点を紹介する。
インテル コンパイラーではOpenMP 3.0やC++ラムダ関数、並列コンパイルといった、新規格や最近注目されている機能がいち早く取り入れられている。本記事では、インテル コンパイラーが採用した新規格について解説する。
インテル コンパイラーの特徴の1つに「自動ベクトル化」がある。これはSSE(Streaming SIMD Extensions)と呼ばれるCPUの機能を利用することで数値演算の高速化を図るものだ。インテル コンパイラーは最新のCore i7といったCPUに搭載されているSSE4.2に対応しており、現行のほとんどのインテルCPUにおいて高速化が期待できる。本記事では、インテルコンパイラーでのSSEの使用と、その効果について解説する。
近年、そのパフォーマンス競争が盛んに行われている分野として、Webブラウザが挙げられる。たとえばSafari 4のベータ版は自らを「世界最高速」とうたうなど、それぞれのWebブラウザが自身の高速性をアピールしているが、それではWebブラウザのコンパイルにインテル コンパイラーを利用することでパフォーマンスを向上できないだろうか? そこで、Firefoxの最新版であるFirefox 3.1 ベータ2について、Windows環境でインテル コンパイラーを使用してコンパイルし、そのパフォーマンスを調査してみた。
作成したプログラムのパフォーマンスに問題がある場合、性能解析ツールを利用して問題点を分析するのが一般的だ。性能解析ツールには様々なものがあるが、その中でも高機能なものとしてインテルが開発する性能解析ツール「インテル VTune パフォーマンス・アナライザー」がある。本記事ではパフォーマンスの問題が発見されたプログラムを対象に、このインテル VTune パフォーマンス・アナライザーを使用して問題点の調査とパフォーマンスの改善を行う例を紹介する。
インテルの「インテル C++ コンパイラー」は高速なバイナリを生成するということで知られている。しかし、インテル C++ コンパイラーはVisual C++やGCCとの互換性を備えているものの、完全に同一というわけではない。そこで、有名なオープンソースソフトウェアについてインテル C++ コンパイラーでのコンパイルを行い、どの程度の修正でコンパイルが可能なのか、またそのパフォーマンスはどうなのか、調査してみよう。
Linux World 2005で発表された「Improving MySQL Server Performance with Intel C++ Compiler」というレポートでは、インテルコンパイラーを利用することでMySQLのパフォーマンスを最大2.55倍向上できた、と報告されている。しかし、本当にこのような大幅なパフォーマンス向上が期待できるのだろうか? 本記事では、インテル コンパイラーでコンパイルされたMySQLバイナリを使用し、本当にこのようなパフォーマンス向上が見られるのか、比較・調査を行う。
本特集内で使用したサンプルコード全文を掲載しています。
インテル C++ コンパイラーに付属するライブラリの1つに「インテル インテグレーテッド・パフォーマンス・プリミティブ」(IPP)がある。IPPは動画や音声、画像などの処理に向けた関数を備えたライブラリなのだが、実際のところIPPがどのようなものなのか分からない方も多いだろう。そこで本記事では、IPPには何が含まれており、またどのような用途に使えるのかを紹介する。
各種スケジューリング処理やシミュレーション、統計処理、デジタル制御や信号処理などの分野では、多次元行列演算や高速フーリエ変換(FFT)、線形計画法など、さまざまな数学的処理が必要とされる。インテル コンパイラーに付属する「インテル マス・カーネル・ライブラリ」(MKL)はこのような処理を高速に実行する数値演算ライブラリで、同社のCPUで高速に動作するよう最適化されているだけでなく、並列処理にも対応しているのが特徴だ。本記事ではMKLが備えている機能を紹介するとともに、フリーのライブラリとのパフォーマンスを比較する。
コンパイラが持つ最適化機能を利用することで、冗長なソースコードから効率の良いバイナリコードを生成できる。そして、よりパフォーマンスを追求したいなら、インテル製CPUに向けた高い最適化を謳う「インテル コンパイラー」を検討したい。本記事では、インテル コンパイラーの特徴や使い方を紹介するとともに、生成したコードのパフォーマンスがVisual C++やGCC3、GCC4と比べてどの程度違うのか、検証を行う。
Windows向けの並列アプリケーション開発支援ツールスイート「インテル Parallel Studio」の最新バージョン「インテル Parallel Studio 2011」がリリースされた。Parallel Studio 2011では並列化の効果やその際に発生しうる問題を分析するツール「インテル Parallel Advisor」が新たに追加されたほか、並列プログラミング向けのC/C++言語拡張「インテル Cilk Plus」や並列化支援ライブラリ「インテル Array Building Blocks」(ベータ版)に対応するなど、大幅なアップデートが行われている。本記事では、これら新機能を中心にParallel Studio 2011を紹介していく。
並列プログラミング向けのコンパイラやデバッガ、各種ライブラリを提供するインテル Parallel Compsoserには、並列プログラミング向けの言語拡張「インテル Cilk Plus」が含まれている。これを利用することで既存のプログラムを容易に並列化したり、より簡潔にアルゴリズムを記述できる。本記事では、このCilk Plusについて機能や使い方を説明する。
インテル Parallel Studio 2011に新たに搭載されたツール「インテル Parallel Advisor」は、並列化したいプログラムを関数・命令レベルで分析し、並列化すべき個所を提案する分析ツールだ。並列化によりパフォーマンスの向上が期待できる個所を検出できるだけでなく、並列化により発生するメモリ関連の問題なども事前に検出できる。本記事ではこのインテル Parallel Advisorを使用し、実際にプログラムの分析や並列化を行う例を紹介する。
C++で並列アプリケーションを実装するためのテンプレートライブラリとして、インテルがリリースしている「Intel Threading Building Blocks」(TBB)がある。TBBはインテル コンパイラーやインテル Parallel Studioといったインテルのコンパイラ製品に付属しているほか、オープンソース版も公開されている。本記事ではこのTBBの概要と、基本的な使い方を解説する。
処理の高速化が強く求められている分野の1つに、画像処理や音声処理、動画処理といったマルチメディア処理が挙げられる。これらのプログラムは処理すべきデータ量も多く、また行う処理も非常に複雑である。そのため、PCの処理速度が向上した現在でも「時間がかかる処理」の代表であり、このような処理にこそ並列化による処理速度の高速化が期待されている。本記事ではフリーの音声エンコーダ「FAAC」をインテルの並列プログラミング支援ツール「インテル Parallel Studio」を使って並列化し、その処理速度を高速化する試みを紹介する。
インテルのCoreシリーズCPUが登場して以来、マルチコアCPUは爆発的に普及している。現在では比較的低価格なCPUでも複数のコアを搭載するようになり、現在販売されているPCのほとんどはマルチコアに対応しているといっても過言ではない。しかし、まだマルチコアCPUの性能を生かす、並列処理を行っているアプリケーションは多くない。本記事では、このような技術を利用した並列処理の実装方法を、簡単な画像処理アプリケーションを例に説明していく。
「インテル Parallel Studio」はマルチスレッドやOpenMPなどを使用した、並列処理を行うプログラムの開発を支援するツールである。本記事では、Parallel Studioに含まれる並列化機能や強力な最適化機能、並列化関連ライブラリ、デバッガ、プロファイラといった機能や、使い方の例などを紹介していく。
インテルが新しい開発ツール「インテル Parallel Studio」を発表した。Parallel StudioはマルチコアCPUで高いパフォーマンスを発揮するソフトウェアを開発するためのツールで、並列化機能および強力な最適化機能を備えたコンパイラや並列化関連ライブラリ、デバッガ、プロファイラから構成されている。本記事では、このParallel Studioの機能や特徴を紹介する。
従来は高級サーバーでしか採用されていなかったマルチCPU/マルチコアが、一般的なPCにも普及しつつある。このようなマルチCPU/マルチコア環境において、高速に動作するアプリケーションを開発するために注目されているのが「並列化」技術である。本記事では、この並列計算の基本的な考え方やそのメリット、利用できるライブラリなどについて紹介する。
[ページ情報]
更新日時: 2011-01-11 20:12:30, 更新者: hiromichi-m
[権限]
表示:無制限, 編集:ログインユーザ, 削除/設定:メンバー