C# Bitmap圖像處理加速的實現
BitmapData類
BitmapData類專門用於位圖處理,與Bitmap的不同點在於,它使用指針直接修改內存,而Bitmap是使用SetPixel()方法間接修改顏色,因此其效率遠遠超過SetPixel()
傳統代碼
以灰度處理為例,為瞭便於演示,此處的灰度算法采用 Gray=(R+G+B) / 3
private void Gray_Tradition() { for(int i = 0; i < bitmap.Width; i++) { for(int j = 0; j < bitmap.Height; j++) { Color color = bitmap.GetPixel(i, j); int RGB = (color.R + color.G + color.B) / 3; bitmap.SetPixel(i, j, Color.FromArgb(255, RGB, RGB, RGB)); } } }
使用BitmapData的代碼
private void Gray_BitmapData() { int width = bitmap.Width, height = bitmap.Height;//圖片的寬度和高度 //在內存中以讀寫模式鎖定Bitmap BitmapData bitmapData = bitmap.LockBits( new Rectangle(0, 0, width, height), ImageLockMode.ReadWrite, PixelFormat.Format24bppRgb); //圖片像素點數組的長度,由於一個像素點占瞭3個字節,所以要乘上3 int size = width * height * 3; //緩沖區數組 byte[] srcArray = new byte[size]; //獲取第一個像素的地址 IntPtr ptr = bitmapData.Scan0; //把像素值復制到緩沖區 Marshal.Copy(ptr, srcArray, 0, size); int p; for (int i = 0; i < width; i++) { for (int j = 0; j < height; j++) { //定位像素點位置 p = j * width * 3 + i * 3; //計算灰度值 byte color = (byte)((srcArray[p] + srcArray[p + 1] + srcArray[p + 2]) / 3); srcArray[p] = srcArray[p + 1] = srcArray[p + 2] = color; } } //從緩沖區復制回BitmapData Marshal.Copy(srcArray, 0, ptr, size); //從內存中解鎖 bitmap.UnlockBits(bitmapData); }
效率對比
代碼
private void onTest() { double t1, t2; Stopwatch watch = new Stopwatch(); watch.Start(); Gray_BitmapData(); watch.Stop(); t1 = watch.Elapsed.TotalMilliseconds; watch.Reset(); watch.Start(); Gray_Tradition(); watch.Stop(); t2 = watch.Elapsed.TotalMilliseconds; MessageBox.Show("BitmapData=" + (long)t1 + "\nTradition=" + (long)t2); }
圖片信息
耗時
可以看到傳統方法的耗時是使用BitmapData方法的106倍,需要整整14秒,而BitmapData僅用瞭0.1秒
GPU加速
使用CUDA生成dll後,可以在GPU上高效處理圖像,但是這種方式需要使用dll,而且異常繁瑣,因此隻適合對效率有極高要求時使用
生成Dll
#include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> #include <Windows.h> __global__ void DoInKernel(byte* o, int num) { int i = blockIdx.x * blockDim.x + threadIdx.x; if (i >= num) return; byte* ori = o + i * 3; ori[0] = ori[1] = ori[2] = (ori[0] + ori[1] + ori[2]) / 3; } extern "C" _declspec(dllexport) void Gray(byte * oriArray, int num) { int size = num * 3 * sizeof(byte); byte* dev_ori; //在GPU上分配內存 cudaMalloc((void**)&dev_ori, size); //把數組復制到顯存 cudaMemcpy(dev_ori, oriArray, size, cudaMemcpyHostToDevice); //計算 DoInKernel << <num / 1024 + 1, 1024 >> > (dev_ori, num); //從顯存復制到內存 cudaMemcpy(oriArray, dev_ori, size, cudaMemcpyDeviceToHost); //釋放 cudaFree(dev_ori); }
實際上GPU的thread和block數量應該根據實際數組大小來動態調整,但是這裡為瞭演示方便,直接定義1024個線程
調用Dll
[DllImport("CUDA.dll", EntryPoint = "Gray", CallingConvention = CallingConvention.Cdecl)] public static extern void Gray(IntPtr ori, int num);
此時不需要定義緩沖區數組瞭,可以直接把數據復制到顯存中使用
private void Gray_GPU() { int width = bitmap.Width, height = bitmap.Height;//圖片的寬度和高度 //在內存中以讀寫模式鎖定Bitmap BitmapData bitmapData = bitmap.LockBits( new Rectangle(0, 0, width, height), ImageLockMode.ReadWrite, PixelFormat.Format24bppRgb); //圖片像素點數組的長度,由於一個像素點占瞭3個字節,所以要乘上3 int size = width * height * 3; //獲取第一個像素的地址 IntPtr ptr = bitmapData.Scan0; Gray(ptr, width * height); //從內存中解鎖 bitmap.UnlockBits(bitmapData); pictureBox1.Refresh(); }
耗時
由於加載dll需要時間,因此第二次執行的耗時才是真正的GPU執行時間
僅用瞭34毫秒
到此這篇關於C# Bitmap圖像處理加速的實現的文章就介紹到這瞭,更多相關C# Bitmap圖像處理加速內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- C# Bitmap圖像處理(含增強對比度的三種方法)
- C#合並BitMap圖像生成超大bitmap
- C++如何實現BitMap數據結構
- c# Bitmap轉bitmapImage高效方法
- 用StopWatch優雅替代currentTimeMillis計算程序執行耗時