C++ OpenCV實戰之手寫數字識別

前言

本案例通過使用machine learning機器學習模塊進行手寫數字識別。源碼註釋也寫得比較清楚啦,大傢請看源碼註釋!!!

一、準備數據集

原圖如圖所示:總共有0~9數字類別,每個數字共20個。現在需要將下面圖片切分成訓練數據圖片、測試數據圖片。該圖片尺寸為560×280,故將其切割成28×28大小數據圖片。具體請看源碼註釋。

	const int classNum = 10;  //總共有0~9個數字類別
	const int picNum = 20;//每個類別共20張圖片
	const int pic_w = 28;//圖片寬
	const int pic_h = 28;//圖片高

	//將數據集分為訓練集、測試集
	double totalNum = classNum * picNum;//圖片總數
	double per = 0.8;	//百分比--修改百分比可改變訓練集、測試集比重
	double trainNum = totalNum * per;//訓練圖片數量
	double testNum = totalNum * (1.0 - per);//測試圖片數量

下面需要將整張圖像一一切割成28×28小尺寸圖片作為數據集,填充至訓練集與測試集。

	Mat Train_Data, Train_Label;//用於訓練
	vector<MyNum>TestData;//用於測試
	for (int i = 0; i < picNum; i++)
	{
		for (int j = 0; j < classNum; j++)
		{
			//將所有圖片數據都拷貝到Mat矩陣裡
			Mat temp;
			gray(Range(j*pic_w, j*pic_w + pic_w), Range(i*pic_h, i*pic_h + pic_h)).copyTo(temp);
			Train_Data.push_back(temp.reshape(0, 1)); //將temp數字圖像reshape成一行數據,然後一一追加到Train_Data矩陣中
			Train_Label.push_back(j);

			//而外用於測試
			if (i * classNum + j >= trainNum)
			{
				TestData.push_back({ temp,Rect(i*pic_w,j*pic_h,pic_w,pic_h),j });
			}
		}
	}

接下來就是要將數據集進行格式轉換。

    //準備訓練數據集
    Train_Data.convertTo(Train_Data, CV_32FC1); //轉化為CV_32FC1類型
    Train_Label.convertTo(Train_Label, CV_32FC1);
    Mat TrainDataMat = Train_Data(Range(0, trainNum), Range::all()); //隻取trainNum行訓練
    Mat TrainLabelMat = Train_Label(Range(0, trainNum), Range::all());

二、KNN訓練

這裡使用OpenCV中的KNN算法進行訓練。

    //KNN訓練
    const int k = 3;  //k值,取奇數,影響最終識別率
    Ptr<KNearest>knn = KNearest::create();  //構造KNN模型
    knn->setDefaultK(k);//設定k值
    knn->setIsClassifier(true);//KNN算法可用於分類、回歸。
    knn->setAlgorithmType(KNearest::BRUTE_FORCE);//字符匹配算法
    knn->train(TrainDataMat, ROW_SAMPLE, TrainLabelMat);//模型訓練

三、模型預測及結果顯示

	//預測及結果顯示
	double count = 0.0;
	Scalar color;
	for (int i = 0; i < TestData.size(); i++)
	{
		//將測試圖片轉成CV_32FC1,單行形式
		Mat data = TestData[i].mat.reshape(0, 1);
		data.convertTo(data, CV_32FC1);
		Mat sample = data(Range(0, data.rows), Range::all());

		float f = knn->predict(sample); //預測
		if (f == TestData[i].label)
		{
			color = Scalar(0, 255, 0); //如果預測正確,繪制綠色,並且結果+1
			count++;
		}
		else
		{
			color = Scalar(0, 0, 255);//如果預測錯誤,繪制紅色
		}

		rectangle(src, TestData[i].rect, color, 2);
	}

	//將繪制結果拷貝到一張新圖上
	Mat result(Size(src.cols, src.rows + 50), CV_8UC3, Scalar::all(255));
	src.copyTo(result(Rect(0, 0, src.cols, src.rows)));
	//將得分在結果圖上顯示
	char text[10];
	int score = (count / testNum) * 100;
	sprintf_s(text, "%s%d%s", "Score:", score, "%");
	putText(result, text, Point((result.cols / 2) - 80, result.rows - 15), FONT_HERSHEY_SIMPLEX, 1, Scalar(0, 255, 0), 2);
	

如圖為不同比重訓練集與測試集識別結果。

四、源碼

#include<iostream>
#include<opencv2/opencv.hpp>
#include<opencv2/ml.hpp>
using namespace std;
using namespace cv;
using namespace cv::ml;


//**自定義結構體
struct MyNum
{
	cv::Mat mat; //數字圖片
	cv::Rect rect;//相對整張圖所在矩形
	int label;//數字標簽
};

int main()
{
	Mat src = imread("digit.png");
	if (src.empty())
	{
		cout << "No Image..." << endl;
		system("pause");
		return -1;
	}

	Mat gray;
	cvtColor(src, gray, COLOR_BGR2GRAY);

	const int classNum = 10;  //總共有0~9個數字類別
	const int picNum = 20;//每個類別共20張圖片
	const int pic_w = 28;//圖片寬
	const int pic_h = 28;//圖片高

	//將數據集分為訓練集、測試集
	double totalNum = classNum * picNum;//圖片總數
	double per = 0.8;	//百分比--修改百分比可改變訓練集、測試集比重
	double trainNum = totalNum * per;//訓練圖片數量
	double testNum = totalNum * (1.0 - per);//測試圖片數量

	Mat Train_Data, Train_Label;//用於訓練
	vector<MyNum>TestData;//用於測試
	for (int i = 0; i < picNum; i++)
	{
		for (int j = 0; j < classNum; j++)
		{
			//將所有圖片數據都拷貝到Mat矩陣裡
			Mat temp;
			gray(Range(j*pic_w, j*pic_w + pic_w), Range(i*pic_h, i*pic_h + pic_h)).copyTo(temp);
			Train_Data.push_back(temp.reshape(0, 1)); //將temp數字圖像reshape成一行數據,然後一一追加到Train_Data矩陣中
			Train_Label.push_back(j);

			//額外用於測試
			if (i * classNum + j >= trainNum)
			{
				TestData.push_back({ temp,Rect(i*pic_w,j*pic_h,pic_w,pic_h),j });
			}
		}
	}

	//準備訓練數據集
	Train_Data.convertTo(Train_Data, CV_32FC1); //轉化為CV_32FC1類型
	Train_Label.convertTo(Train_Label, CV_32FC1);
	Mat TrainDataMat = Train_Data(Range(0, trainNum), Range::all()); //隻取trainNum行訓練
	Mat TrainLabelMat = Train_Label(Range(0, trainNum), Range::all());

	//KNN訓練
	const int k = 3;  //k值,取奇數,影響最終識別率
	Ptr<KNearest>knn = KNearest::create();  //構造KNN模型
	knn->setDefaultK(k);//設定k值
	knn->setIsClassifier(true);//KNN算法可用於分類、回歸。
	knn->setAlgorithmType(KNearest::BRUTE_FORCE);//字符匹配算法
	knn->train(TrainDataMat, ROW_SAMPLE, TrainLabelMat);//模型訓練

	//預測及結果顯示
	double count = 0.0;
	Scalar color;
	for (int i = 0; i < TestData.size(); i++)
	{
		//將測試圖片轉成CV_32FC1,單行形式
		Mat data = TestData[i].mat.reshape(0, 1);
		data.convertTo(data, CV_32FC1);
		Mat sample = data(Range(0, data.rows), Range::all());

		float f = knn->predict(sample); //預測
		if (f == TestData[i].label)
		{
			color = Scalar(0, 255, 0); //如果預測正確,繪制綠色,並且結果+1
			count++;
		}
		else
		{
			color = Scalar(0, 0, 255);//如果預測錯誤,繪制紅色
		}

		rectangle(src, TestData[i].rect, color, 2);
	}

	//將繪制結果拷貝到一張新圖上
	Mat result(Size(src.cols, src.rows + 50), CV_8UC3, Scalar::all(255));
	src.copyTo(result(Rect(0, 0, src.cols, src.rows)));
	//將得分在結果圖上顯示
	char text[10];
	int score = (count / testNum) * 100;
	sprintf_s(text, "%s%d%s", "Score:", score, "%");
	putText(result, text, Point((result.cols / 2) - 80, result.rows - 15), FONT_HERSHEY_SIMPLEX, 1, Scalar(0, 255, 0), 2);
	imshow("test", result);
	imwrite("result.jpg", result);
	waitKey(0);
	system("pause");
	return 0;
}

總結

本文使用OpenCV C++ 利用ml模塊進行手寫數字識別,源碼註釋也比較詳細,主要操作有以下幾點。

1、數據集劃分為訓練集與測試集

2、進行KNN訓練

3、進行模型預測以及結果顯示

以上就是C++ OpenCV實戰之手寫數字識別的詳細內容,更多關於C++ OpenCV手寫數字識別的資料請關註WalkonNet其它相關文章!

推薦閱讀: