OpenCVテンプレートマッチングと低解像度化で、駒を検出する

投稿日: 2011/11/23 作成者: masuda

OpenCV のテンプレートマッチを使って駒を検出 | Moonmile Solutions Blog
http://www.moonmile.net/blog/archives/2468

の続きです。

先のテンプレートマッチングが遅かった原因は、2 つあって、

cv::matchTemplate を呼び出して、MaxMin を検索した後に、再び cv::matchTemplate を呼び出しているのが無駄。
元画像をそのままマッチング対象にしているので、低解像度にすれば早くなる？

ってところです。

前者の cv::matchTemplate の多重呼び出しは完全にコーディングミスですね。50 個の max を取るのに、いちいち cv::matchTemplate を呼び出す必要はありません。一回だけ呼び出して、その結果の画像を使って 50 個の max を cv::minMaxLoc で取得すれば良いのです、これで結構速くなります。

後者の低解像度化のほうは、以前から考えていて、高解像度のままマッチングをして検出しようとすると、細かい部分に敏感になってしまうという現象が発生します。細かいところというのは、取得画像のノイズであったり、微妙な手振れであったり、教師画像（テンプレートマッチで見つける画像）の違いによってスコアが大きく異なる、という現象です。このために、平滑化が行われることが多いのですが、わざわざ高解像度であるものを平滑化してしてしまうのはどうかなぁ、と思っていたので、実験しています。平滑化を行うのではなく、単純に低解像化します。低解像度にするときは、となりのドットの平均値を取る…ようなことはせず、単純に間引きます。間引いてしまうと、実はノイズに敏感になってしまうという不利が働く可能性があるのですが、そのあたりが高速化を優先して…というか、実際に目から入る情報をそのまま使う、という方針でいきます。

で、ざっと書いたコードがこんな感じ。

#include "stdafx.h"
#include <iostream>
#include "opencv/cv.h"
#include "opencv/highgui.h"
using namespace std;

/// 低解像度クラス
class RowReso
{
private:
	cv::Mat *_org_img;
	cv::Mat *_reso_img;
	cv::Mat *_reso_org;

	int _reso ;
	int _reso_width ;
	int _reso_height ;

public:
	RowReso()
	{
		_org_img = NULL;
		_reso_img = NULL;
		_reso_org = NULL;
	}
	~RowReso()
	{
		if ( _reso_img != NULL ) delete _reso_img;
		if ( _reso_org != NULL ) delete _reso_org;
	}

	// 初期化
	void Initialize( cv::Mat& img, int reso )
	{
		int width  = img.cols / reso;
		int height = img.rows / reso;

		_org_img = &img ;
		_reso_img = new cv::Mat(height, width, CV_MAKETYPE(img.depth(),img.channels()));
		_reso = reso ;
		_reso_width = width ;
		_reso_height = height ;
	}
	// 低解像度を作成
	cv::Mat& Do()
	{
		for ( int y=0; y<_reso_height; ++y ) {
			for ( int x=0; x<_reso_width; ++x ) {
				int x1 = (_reso+1)/2 + _reso*x;
				int y1 = (_reso+1)/2 + _reso*y;
				cv::Vec3b &v = _org_img->at<cv::Vec3b>(y1,x1);
				// cout << x << "," << y << endl;
				_reso_img->at<cv::Vec3b>(y,x) = v;
			}
		}
		return *_reso_img;
	}
	// 確認用に元の画像の大きさに戻す
	cv::Mat& GetOriginalSize()
	{
		if ( _reso_org == NULL ) {
			_reso_org = new cv::Mat(
				_org_img->rows, _org_img->cols,
				CV_MAKETYPE(_org_img->depth(),_org_img->channels()));
		}
		for ( int y=0; y<_reso_height; ++y ) {
			for ( int x=0; x<_reso_width; ++x ) {
				cv::Vec3b &v = _reso_img->at<cv::Vec3b>(y,x);
				for ( int y1=0; y1<_reso; ++y1 ) {
					for ( int x1=0; x1<_reso; ++x1 ) {
						_reso_org->at<cv::Vec3b>(y*_reso+y1,x*_reso+x1) = v ;
					}
				}
			}
		}
		return *_reso_org;
	}
};

int main2(int argc, char **argv );

int main(int argc, char **argv )
{
	if ( argc == 2 ) {
		main2( argc, argv );
		return 0;
	}
	cv::VideoCapture cap;
	cap.open(0);
	cap.set( CV_CAP_PROP_FRAME_WIDTH, 640 );
	cap.set( CV_CAP_PROP_FRAME_HEIGHT, 480 );

  	cv::namedWindow("camera", CV_WINDOW_AUTOSIZE|CV_WINDOW_FREERATIO);
  	cv::namedWindow("reso", CV_WINDOW_AUTOSIZE|CV_WINDOW_FREERATIO);
  	cv::namedWindow("reso org", CV_WINDOW_AUTOSIZE|CV_WINDOW_FREERATIO);
  	cv::namedWindow("reso koma", CV_WINDOW_AUTOSIZE|CV_WINDOW_FREERATIO);

	char fname[256];
	cv::Mat img_koma[7];
	for ( int i=0; i<7; i++ ) {
		sprintf( fname, "D:\\work\\OpenCV\\src\\mini\\koma%02d.png", i+1 );
		img_koma[i] = cv::imread(fname);
	}

	// 初回だけ読み込む
	cv::Mat img;
	cap >> img ;

	int reso = 3 ;
	RowReso Reso, ResoKoma[7];
	Reso.Initialize( img, reso );
	cv::Mat img_reso_komas[7];
	for ( int i=0; i<7; i++ ) {
		ResoKoma[i].Initialize( img_koma[i], reso );
		// 低解像度の教師画像
		img_reso_komas[i] = ResoKoma[i].Do();
	}

	// 枠線の色
	cv::Scalar cols[7];
	cols[0] = cv::Scalar(0,0,255);
	cols[1] = cv::Scalar(0,255,255);
	cols[2] = cv::Scalar(255,0,255);
	cols[3] = cv::Scalar(255,0,0);
	cols[4] = cv::Scalar(0,255,0);
	cols[5] = cv::Scalar(255,255,0);
	cols[6] = cv::Scalar(255,255,255);

	while ( 1 ) {
		cap >> img ;

		cv::Mat &img_reso = Reso.Do();
		cv::Mat &img_reso_org = Reso.GetOriginalSize();

		cv::Mat img_search, img_result ;
		img_reso.copyTo( img_search );

		for ( int j=0; j<7; j++ ) {
			cv::Mat &img_reso_koma = img_reso_komas[j];

			// テンプレートマッチング
			cv::matchTemplate(img_search, img_reso_koma, img_result, CV_TM_CCOEFF_NORMED);

			// 50 個検出する
	  		for ( int i=0; i<50; i++ ) {
				  // 最大のスコアの場所を探す
				  cv::Point max_pt;
				  double maxVal;
				  cv::minMaxLoc(img_result, NULL, &maxVal, NULL, &max_pt);
				  // 一定スコア以下の場合は処理終了
				  if ( maxVal < 0.5 ) break;

				  cv::Rect roi_rect(0, 0, img_reso_koma.cols, img_reso_koma.rows);
				  roi_rect.x = max_pt.x ;
				  roi_rect.y = max_pt.y ;
				  cv::Rect roi_rect_org( roi_rect.x * reso , roi_rect.y * reso ,
					  img_reso_koma.cols*reso, img_reso_koma.rows*reso );

				  // std::cout << i << ":(" << max_pt.x << ", " << max_pt.y << "), score=" << maxVal << std::endl;
				  // 探索結果の場所に矩形を描画
				  cv::rectangle(img_reso_org, roi_rect_org, cols[i], 3);
				  // cv::rectangle(img_search, roi_rect, cv::Scalar(0,0,0), CV_FILLED);

				  // 検出済みは 0.0 で塗りつぶし
				  for ( int y=0; y<img_reso_koma.rows; y++ ) {
					  for ( int x=0; x<img_reso_koma.cols; x++ ) {
						  int xx = max_pt.x + x - img_reso_koma.cols/2;
						  int yy = max_pt.y + y - img_reso_koma.rows/2;
						  if ( 0 <= xx && xx < img_result.cols-1 ) {
							  if ( 0 <= yy && yy < img_result.rows-1 ) {
								  img_result.at<int>(yy,xx) = 0;
							  }
						  }
					  }
				  }
				  // koma.push_back( roi_rect );
			}
		}
		cv::imshow("camera", img );
		cv::imshow("reso", img_reso);
		cv::imshow("reso org", img_reso_org);

		char ch = cv::waitKey(30);
		if ( ch == 27 ) break;
	}
	return 0;
}

RowReso クラスは、単純に cv:Mat の中身を間引きしているだけです。
低解像化する率は「3」という奇数を取ります。中央の点をサンプリングしたかったためなのですが、本当は左上の点でもよいのかもしれません。これは後で実験します。

多少、カクカクとしますが、ほどよくマッチングができています。
7 つの駒を、低解像度の画素数（640×480 の 1/3 なので、210×160 = 34000）で検索するので、24 万回のマッチングの計算をしています。低解像度にしたので、9 倍ほど早くなっているはずです。教師画像も 1/3 サイズになっているので、マッチング自体の速度アップも寄与していると思います。

で、検出の精度はどうかというと、良いような悪いような、という感じですね。右のほうに黒の枠がでているので、ここで誤検出しています。また、ところどこ抜けがでているので、検出できない駒もあります。これは 0.5 の足切りになってしまった箇所です。
加えて、実際に実行してみると分かるのですが、検出の色がちかちかと変わります。検出している駒のマッチングで、複数マッチしているものがあるわけです。

このあたりの誤検出は想定のうちで、低解像度によっておおまかな駒の位置がわかったら、高解像度のほうで駒の検出をやり直します。このあたり、人間の目でも、アクションパズルをする場合、大まかに色か形で目で追って、その後でじっと凝視して本当にそれが認識した駒とあっているかどうか？を確認するという認識手順になる…と思うのでそれに準じます。

あと、テンプレートマッチの回数自体は、初回のみ（あるいはパズルが一旦消えた、あるいは iPhone が大きく動いた）ときに必要で、続くフレームのほうでは、先に認識した駒の位置から類推をさせることで、マッチングの範囲を極端に減らすことが可能です。低解像の駒は 10×10 程度なので、これに 2 倍の幅を持たせて 20×20 x 盤面7×7 = 2万回のマッチングで良くなるはずです。

ってな訳で後日。

カテゴリー: C++, OpenCV パーマリンク

OpenCVテンプレートマッチングと低解像度化で、駒を検出するへの4件のフィードバック

ばばのコメント:

2013/07/17 6:32 pm

管理人さま。
はじめまして、ばばと申します。

記事、拝見しました。自身の趣味のため、この記事と同じような事をしたいと考えています。
私は、OpenCVに関してはC言語の知識しかないので、記載されているソースコードを上からざーっと読んで、Cに変換しつつ理解していこうと試行していたのですが、171行目の

img_result.at(yy,xx) = 0;

が何を表しているのか分かりません。差し支えなければ、171行付近の挙動のご説明をして頂けないでしょうか。そしてC言語に書き換える事が可能であれば、171行付近の挙動をCで書き換えたものも教えて頂きたく思います。
よろしくお願い致します。
masuda のコメント:

2013/07/19 11:37 am

171行目付近は、ソースのコメントにある通り「検出済みは 0.0 で塗りつぶし」をしています。
テンプレートマッチングですでに検出済みの領域を、黒で塗りつぶしておいて、二重にマッチングするのを防いでいます。座標値だけだと少しずれた領域でマッチングが発生するので、これの防止策ですね。
ばばのコメント:

2013/09/05 3:47 pm

以前質問した、ばばです。

どうやら管理人さまの大変な時期に質問してしまったと後で気が付き、
申し訳ない事をしました。それでも返信して頂いた事に感謝しております。

おかげさまで、様々なものが試験的に実装できました。
ありがとうございました。
- masuda のコメント:
  
  2013/09/12 10:36 am
  
  お役に立てたようで何よりです。
  >どうやら管理人さまの大変な時期に質問してしまったと後で気が付き、
  >申し訳ない事をしました。それでも返信して頂いた事に感謝しております。
  ひとまず解決に至ったので、良しと言うことでです。したくない経験ではありましたが、経験も財産ですから、ということで。
  
  当時はCPUのパワーが足りなくて、パターンマッチング法だとスピードが足りないと思っていたのですが、最近のCPUと並列化を利用すれば結構なスピードがでますよね。特徴量抽出をやっていたので、そっちを調べていたのですが、ごり押しのCUPパワーでテンプレートマッチングでも結構いいかな、と今は思っています。
  
  ちょっともう少ししたら、OpenCV を再開したいところです。OpenNI の本も買ったし。

コメントは停止中です。

検索:
2024年4月

日月火水木金土

1 2 3 4 5 6

7 8 9 10 11 12 13

14 15 16 17 18 19 20

21 22 23 24 25 26 27

28 29 30

« 3月
MVP Visual C++ 2011-
MVP ASP.NET/IIS 2012-
MVP Visual C# 2013, 2014
MVP Windows Development 2015-2023
■ ■ ■ ■
最近の投稿
最近のコメント
- 学童でプログラミング教室を開いた3年間の話に masuda より
- 学童でプログラミング教室を開いた3年間の話につっちんより
- Windows で Raspberry Pi のバックアップを取る方法に Raspberry Piでキオスク端末を | Nacky – Snowland.net より
- Microsoft OCR をデスクトップのWFPアプリで動かす方法に Office系ソフトでOCRしたい　より
- SQLite で LINQ を使うに C#でSQLite3を使ってみる | IT技術情報局より
- Xamarin.Forms でドラッグを実装しよう（Xamarin.Forms on Android編）に GITARAKULU より
- HDDのアクセススピードは VMWare に影響するのか？に SIREN より
- [win8] 画像加工をDirectXに任せて、UIはC#にする技に WindowsストアアプリでDirect2D描画のRGB値を得る方法を考えてみた。 « M-AE、山科駐在員のブログより
- [win8] metro アプリケーションからデスクトップアプリにプロセス間通信するに jun maeda より
- 必ず成功するための100の開発手順(メモ) に masuda より
menu
アーカイブ
- 2024年4月 (10)
- 2024年3月 (4)
- 2023年7月 (1)
- 2023年6月 (2)
- 2023年5月 (6)
- 2022年12月 (1)
- 2022年9月 (2)
- 2022年8月 (1)
- 2022年7月 (1)
- 2022年2月 (1)
- 2021年12月 (1)
- 2021年11月 (3)
- 2021年10月 (2)
- 2021年9月 (2)
- 2021年3月 (2)
- 2021年1月 (3)
- 2020年12月 (3)
- 2020年8月 (2)
- 2020年7月 (3)
- 2020年4月 (4)
- 2020年3月 (1)
- 2020年2月 (1)
- 2019年11月 (1)
- 2019年10月 (2)
- 2019年9月 (6)
- 2019年8月 (5)
- 2019年7月 (2)
- 2019年6月 (1)
- 2019年5月 (1)
- 2019年4月 (2)
- 2019年3月 (2)
- 2019年2月 (8)
- 2019年1月 (4)
- 2018年12月 (3)
- 2018年11月 (4)
- 2018年10月 (7)
- 2018年9月 (2)
- 2018年8月 (1)
- 2018年7月 (3)
- 2018年6月 (12)
- 2018年5月 (15)
- 2018年4月 (1)
- 2018年1月 (1)
- 2017年12月 (3)
- 2017年11月 (2)
- 2017年10月 (4)
- 2017年9月 (4)
- 2017年8月 (3)
- 2017年7月 (4)
- 2017年6月 (7)
- 2017年5月 (1)
- 2017年4月 (1)
- 2017年2月 (1)
- 2017年1月 (3)
- 2016年12月 (10)
- 2016年11月 (9)
- 2016年10月 (10)
- 2016年9月 (20)
- 2016年8月 (8)
- 2016年6月 (4)
- 2016年4月 (5)
- 2016年3月 (3)
- 2016年2月 (7)
- 2016年1月 (11)
- 2015年12月 (9)
- 2015年11月 (4)
- 2015年10月 (8)
- 2015年9月 (8)
- 2015年8月 (3)
- 2015年7月 (5)
- 2015年6月 (4)
- 2015年5月 (16)
- 2015年4月 (7)
- 2015年3月 (14)
- 2015年2月 (9)
- 2015年1月 (1)
- 2014年12月 (11)
- 2014年11月 (8)
- 2014年10月 (19)
- 2014年9月 (15)
- 2014年8月 (12)
- 2014年7月 (11)
- 2014年6月 (16)
- 2014年5月 (8)
- 2014年4月 (12)
- 2014年3月 (19)
- 2014年2月 (11)
- 2014年1月 (16)
- 2013年12月 (4)
- 2013年11月 (1)
- 2013年10月 (2)
- 2013年9月 (16)
- 2013年8月 (4)
- 2013年7月 (12)
- 2013年6月 (5)
- 2013年5月 (6)
- 2013年4月 (24)
- 2013年3月 (29)
- 2013年2月 (21)
- 2013年1月 (2)
- 2012年12月 (4)
- 2012年11月 (12)
- 2012年10月 (13)
- 2012年9月 (19)
- 2012年8月 (17)
- 2012年7月 (12)
- 2012年6月 (11)
- 2012年5月 (17)
- 2012年4月 (20)
- 2012年3月 (11)
- 2012年2月 (19)
- 2012年1月 (30)
- 2011年12月 (27)
- 2011年11月 (13)
- 2011年10月 (5)
- 2011年9月 (15)
- 2011年8月 (10)
- 2011年7月 (12)
- 2011年6月 (6)
- 2011年5月 (6)
- 2011年4月 (13)
- 2011年3月 (20)
- 2011年2月 (40)
- 2011年1月 (20)
- 2010年12月 (10)
- 2010年11月 (15)
- 2010年10月 (6)
- 2010年9月 (16)
- 2010年8月 (25)
- 2010年7月 (31)
- 2010年6月 (7)
- 2010年5月 (20)
- 2010年4月 (13)
- 2010年3月 (10)
- 2010年2月 (10)
- 2010年1月 (1)
- 2009年12月 (11)
- 2009年11月 (15)
- 2009年10月 (15)
- 2009年9月 (7)
- 2009年8月 (1)
- 2009年7月 (2)
- 2009年6月 (14)
- 2009年5月 (23)
- 2009年4月 (19)
カテゴリー
- 開発 (932)
  - ASP.NET (26)
  - AllJoyn (2)
  - Android (22)
  - Arduino (22)
  - Azure (15)
  - Azure Functions (1)
  - Bluetooth (5)
  - C# (223)
  - C++ (61)
  - C++/CX (9)
  - CakePHP (36)
  - Docker (1)
  - Excel VBA (2)
  - F# (51)
  - Fortran (10)
  - Javascript (1)
  - M5Stack (2)
  - MonoBrick (2)
  - MySQL (11)
  - NET Core (7)
  - Netduino (2)
  - Objective-C (18)
  - OpenCV (13)
  - PHP (2)
  - PIC (1)
  - Perl (1)
  - QXエディタ (5)
  - ROS (2)
  - RaspberryPi (48)
  - RmClient (1)
  - SQLite (4)
  - Scratch (4)
  - Slack (3)
  - Smalltalk (1)
  - Swift (1)
  - TDD (7)
  - TiddlyBot (1)
  - Trac (4)
  - Umbraco (1)
  - VB (19)
  - WPF (11)
  - Win IoT (19)
  - WinRT (60)
  - Windows 10 (5)
  - Windows Phone (2)
  - Wordpress (20)
  - XAML (12)
  - Xamarin (85)
  - iOS (13)
  - iPad (5)
  - mBot (1)
  - mbed (1)
  - python (2)
  - xUnit (12)
  - サイドバーガジェット (5)
  - データベース (4)
  - ブログパーツ (15)
  - 子供ツイッター (3)
  - 技術メルマガ (3)
  - 組み込みボード (4)
- 設計 (33)
- UIDD (7)
- プロジェクト管理 (42)
- Plan Language (7)
- 仕事 (21)
- ツール (49)
  - EXDoc (9)
  - XmlDom (3)
  - 花札ゲーム (4)
- 起業塾 (12)
- 書籍 (9)
- ブログ (5)
- 雑談 (153)
- PDA (11)
- インストールマニアックス2009 (7)
- EV3 (5)
- FEM (1)
- OpenCCPM (5)
- PLEN2 (2)
- PP-Club (3)
- RealSense (2)
- chu (5)
- windows 8 (59)
- windows 8.1 (4)
- のだめ開発プロセス (5)
- アズレン (1)
- ギター (2)
- ソフトウェア開発者の道具箱 (4)
- トラブルシューティング (7)
- パフォーマンス (7)
- プチロボ (6)
- ロボットアーム (2)
- 勉強会 (12)
- 最強.NET開発PC (13)
- 段取り (3)
- 艦これ (12)
Blogroll
リファレンス
メタ情報

2024年4月
日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

OpenCVテンプレートマッチングと低解像度化で、駒を検出する

OpenCVテンプレートマッチングと低解像度化で、駒を検出する への4件のフィードバック

最近の投稿

最近のコメント

menu

アーカイブ

カテゴリー

Blogroll

リファレンス

メタ情報

OpenCVテンプレートマッチングと低解像度化で、駒を検出するへの4件のフィードバック