首页 / ANDROID / android-GPU与CPU编程：处理时间不一致

android-GPU与CPU编程：处理时间不一致

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了android-GPU与CPU编程：处理时间不一致，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含8318字，纯文字阅读大概需要12分钟。

内容图文

我目前正在进行图像跟踪：由于有了摄像头,我可以跟踪与Android系统交互的手指触摸.图像处理是在带有OpenCL的GPU上完成的：我将相机输出转换为黑白帧,以便获得白色斑点.该方法的处理时间为65ms.
由于我的目标是使程序更流畅,因此我使用OpenCV方法在CPU上执行了相同的操作.这样处理时间为115ms.问题在于,使用OpenCV方法时,程序感觉更加灵敏,速度更快,而且我不了解在这种情况下处理时间如何更长：这似乎与我矛盾.
对于测量,我这样进行：

start= clock();
finish = clock();
double time =((double)finish -start)/CLOCKS_PER_SEC;
std::cout<<"process time : "<< time<<std::endl;

这是我的代码：

static cv::Mat              original_Right,binary_Right;
static cv::Mat              original_Left, binary_Left;
int                 width, height;
clock_t                 start,finish;
double time = 0.0;

width = (int) this->camera_Right.getCapture().get(cv::CAP_PROP_FRAME_WIDTH);
height = (int) this->camera_Right.getCapture().get(cv::CAP_PROP_FRAME_HEIGHT);
original_Right.create(height, width, CV_8UC3);


//--------------------------- Camera 2 ---------------------------------
int width_2 = (int) this->camera_Left.getCapture().get(cv::CAP_PROP_FRAME_WIDTH);
int height_2 = (int) this->camera_Left.getCapture().get(cv::CAP_PROP_FRAME_HEIGHT);
original_Left.create(height_2, width_2, CV_8UC3);


binary_Right.create(height, width, CV_32F); // FOR GPU
binary_Left.create(height_2, width_2, CV_32F); // FOR GPU
//binary_Right.create(height, width, CV_8UC1); // FOR CPU
//binary_Left.create(height_2, width_2, CV_8UC1); // FOR CPU

Core::running_ = true;


//------------------------------------ SET UP THE GPU -----------------------------------------
cl_context              context;
cl_context_properties   properties [3];
cl_kernel               kernel;
cl_command_queue        command_queue;
cl_program              program;
cl_int                  err;
cl_uint                 num_of_platforms=0;
cl_platform_id          platform_id;
cl_device_id            device_id;
cl_uint                 num_of_devices=0;
cl_mem                  input, output;

size_t                  global;

int                     data_size =height*width*3;


//load opencl source
FILE *fp;
char fileName[] = "./helloTedKrissV2.cl";
char *source_str;

 //Load the source code containing the kernel
fp = fopen(fileName, "r");
if (!fp) {
fprintf(stderr, "Failed to load kernel.\n");
exit(1);
}
source_str = (char*)malloc(MAX_SOURCE_SIZE);
global = fread(source_str, 1, MAX_SOURCE_SIZE, fp);
fclose(fp);


//retreives a list of platforms available
if(clGetPlatformIDs(1,&platform_id, &num_of_platforms)!=CL_SUCCESS){
    std::cout<<"unable to get a platform_id"<<std::endl;
};

// to get a supported GPU device
if(clGetDeviceIDs(platform_id,CL_DEVICE_TYPE_GPU,1,&device_id, &num_of_devices)!= CL_SUCCESS){
    std::cout<<"unable to get a device_id"<<std::endl;      
};

//context properties list - must be terminated with 0
properties[0]=CL_CONTEXT_PLATFORM;
properties[1]=(cl_context_properties) platform_id;
properties[2]=0;

// create a context with the gpu device
context = clCreateContext(properties,1,&device_id,NULL,NULL,&err);

//create command queue using the context and device
command_queue = clCreateCommandQueue(context,device_id,0,&err);

//create a program from the kernel source code
program= clCreateProgramWithSource(context,1,(const char **) &source_str, NULL,&err);

// compile the program
if(clBuildProgram(program,0,NULL,NULL,NULL,NULL)!=CL_SUCCESS){
    size_t length;
    std::cout<<"Error building program"<<std::endl;
    char buffer[4096];
    clGetProgramBuildInfo(program,device_id,CL_PROGRAM_BUILD_LOG, sizeof(buffer),buffer,&length);
    std::cout<< buffer <<std::endl;
}

//specify which kernel from the program to execute
kernel = clCreateKernel(program,"imageProcessing",&err);




while (this->isRunning() == true) { 

    start= clock(); //--------------------- START----------------------

    //----------------------FRAME---------------------
    this->camera_Right.readFrame(original_Right);
    if (original_Right.empty() == true ) {
        std::cerr << "[Core/Error] Original  frame is empty." << std::endl;
        break;
    }

    this->camera_Left.readFrame(original_Left);
    if (original_Left.empty() == true ) {
        std::cerr << "[Core/Error] Original 2  frame is empty." << std::endl;
        break;
    }
    //----------------------FRAME---------------------



  //------------------------------------------------IMP GPU ------------------------------------------------------

    input = clCreateBuffer(context, CL_MEM_READ_WRITE | CL_MEM_ALLOC_HOST_PTR  , sizeof(unsigned char)*data_size,NULL,NULL);
    output =clCreateBuffer(context,CL_MEM_READ_WRITE   | CL_MEM_ALLOC_HOST_PTR, sizeof(float)*data_size/3,NULL,NULL);

   if(clEnqueueWriteBuffer(command_queue,input,CL_TRUE,0,sizeof(unsigned char)*data_size, original_Right.data ,0,NULL,NULL )!= CL_SUCCESS){};

    //set the argument list for the kernel command
    clSetKernelArg(kernel,0,sizeof(cl_mem), &input);
    clSetKernelArg(kernel,1,sizeof(cl_mem), &output);
    global = data_size  ;
    //enqueue the kernel command for execution
    clEnqueueNDRangeKernel(command_queue, kernel, 1, NULL, &global, NULL,0,NULL,NULL);
    clFinish(command_queue);
    //copy the results from out of the  output buffer
    if(clEnqueueReadBuffer(command_queue,output,CL_TRUE ,0,sizeof(float)*data_size/3,binary_Right.data,0,NULL,NULL )!= CL_SUCCESS){};

    clReleaseMemObject(input);
    clReleaseMemObject(output);

    //------------------------------------------------IMP GPU ------------------------------------------------------

    input = clCreateBuffer(context, CL_MEM_READ_WRITE | CL_MEM_ALLOC_HOST_PTR  , sizeof(unsigned char)*data_size,NULL,NULL);
    output =clCreateBuffer(context,CL_MEM_READ_WRITE   | CL_MEM_ALLOC_HOST_PTR, sizeof(float)*data_size/3,NULL,NULL);

   if(clEnqueueWriteBuffer(command_queue,input,CL_TRUE,0,sizeof(unsigned char)*data_size, original_Left.data ,0,NULL,NULL )!= CL_SUCCESS){};

    //set the argument list for the kernel command
    clSetKernelArg(kernel,0,sizeof(cl_mem), &input);
    clSetKernelArg(kernel,1,sizeof(cl_mem), &output);
    global = data_size  ;
    //enqueue the kernel command for execution
    clEnqueueNDRangeKernel(command_queue, kernel, 1, NULL, &global, NULL,0,NULL,NULL);
    clFinish(command_queue);
    //copy the results from out of the  output buffer
    if(clEnqueueReadBuffer(command_queue,output,CL_TRUE ,0,sizeof(float)*data_size/3,binary_Left.data,0,NULL,NULL )!= CL_SUCCESS){};

   clReleaseMemObject(input);
   clReleaseMemObject(output);

    //------------------------------------------------IMP GPU ------------------------------------------------------

  // CPU METHOD
  // adok::processing::doImageProcessing(original_Right, binary_Right);
  // adok::processing::doImageProcessing(original_Left, binary_Left);

    //-------------------------------------------------------------- TRACKING ------------------------------------------------------

adok::tracking::doFingerContoursTracking(binary_Right,binary_Left, this->fingerContours, this->perspective_Right,this->perspective_Left, this->distortion_Right,this->distortion_Left, this);

    //------------------------------------------- TRACKING -----------------------------------------

 //------------------------------SEND COORDINATES TO ANDROID BOARD--------------------
if (getSideRight() && !getSideLeft() ) {
        std::cout<<"RIGHT : "<<std::endl;
        this->uart_.sendAll(this->fingerContours, this->perspective_Right.getPerspectiveMatrix(), RIGHT);
    }else if (!getSideRight() && getSideLeft() ){
        std::cout<<"LEFT : "<<std::endl;
        this->uart_.sendAll(this->fingerContours, this->perspective_Left.getPerspectiveMatrix(), LEFT);
    }else if (getSideRight() && getSideLeft() ){
        std::cout<<"RIGHT & LEFT : "<<std::endl;
        this->uart_.sendAll(this->fingerContours, this->perspective_Right.getPerspectiveMatrix(), this->perspective_Left.getPerspectiveMatrix());

    }

this->setSideRight(0);
this->setSideLeft(0);

finish = clock();
time =(double)(finish - start)/CLOCKS_PER_SEC;
std::cout << "Time: " << time << std::endl; // ------------END-----------

}
clReleaseCommandQueue(command_queue);
clReleaseProgram(program);
clReleaseKernel(kernel);
clReleaseContext(context);
this->stop();

}

还有一点奇怪,当我在CPU上抓帧的时间是5毫秒,而在GPU上抓帧的时间是15毫秒,我不知道为什么它会增加.

而且我正在研究android xu4.

解决方法:

在GPU计算中,有时可能要比CPU计算花费更多时间.因为,对于GPU计算,主进程将数据发送到GPU内存,而在进行数学计算之后,GPU将数据发送回CPU.因此,数据传输和接收回到CPU需要时间.如果计算出的缓冲区大小较大且传输时间较大,则GPU计算可能会花费更多时间. CUDNN库与GPU处理器一起使它快了很多倍.因此,如果您的程序未使用CUDNN,则速度可能会更慢.

内容总结

以上是互联网集市为您收集整理的android-GPU与CPU编程：处理时间不一致全部内容，希望文章能够帮你解决android-GPU与CPU编程：处理时间不一致所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/665131.html

来源：【匿名】

【上一篇】android-错误：Google id_token不允许与此应用程序一起使用. Firebase访问在工作后失败【下一篇】如何解决android php 中文乱码问题

更多 ►

【android-GPU与CPU编程：处理时间不一致】教程文章相关的互联网学习教程文章

Android 编程之入门开发文件夹管理器开发文件事件操作-2【图】

上一篇博客，我们已经得到了文件夹列表，我们需要对文件列表子项添加事件，比如我们点击的是文件，就执行打开操作，点击的是文件夹执行打开文件夹操作，遍历文件清单，以此类推直到最后一个是文件位置，关于文件与文件夹的处理后面会讲到在我的程序里，我写了一个类，对文件进行处理，FileOpreationUitl：package com.example.util; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; impor...

【读书笔记《Android游戏编程之从零开始》】16.游戏开发基础（动画）【代码】【图】

1. Animation动画在Android 中，系统提供了动画类 Animation ，其中又分为四种动画效果：● AlphaAnimation：透明度渐变动画● ScaleAnimation：渐变尺寸缩放动画；● TranslateAnimation：移动动画● RotateAnimation：旋转动画这4种动画效果的创建方法如下：(1) AlphaAnimation 透明度渐变动画Animation alphaA = new AlphaAnimation(float fromAlpha,float toAlpha)第一个参数：动画开始时的透明度第二个参数：动画结束时的透...

Android之网络编程利用PHP操作MySql插入数据（四）【代码】【图】

因为最近在更新我的项目，就想着把自己在项目中用到的一些的简单的与网络交互的方法总结一下，所以最近Android网络编程方面的博文会比较多一些，我尽量以最简单的方法给大家分享，让大家明白易懂。如果有什么不对的地方，还请大家留言指出。这次是利用PHP操作MySql，将Android上面输入的数据插入到MySql中，这里我已经给大家写好了PHP端的代码，如果大家想要自己测试，只需要将php端的代码复制即可，Android端的代码得换包。OK，...

Android开发中网络编程与常见功能优化总结

Android提供的AsyncTask，但事实上AsyncTask的问题更加严重，Thread只有在run函数不结束时才出现这种内存泄露问题，然而AsyncTask内部的实现机制是运用了 ThreadPoolExcutor,该类产生的Thread对象的生命周期是不确定的，是应用程序无法控制的，因此如果AsyncTask作为Activity的内部类，就更容易出现内存泄露的问题。一般的应用都是从服务器获取数据，然后通过极致的界面风格，将数据清晰，明朗的展现给用户。那么就可以分为这两块...

Android编程心得-ListView子项点击无反应的解决办法

在使用ListView控件的过程中，当子项包括Button或者CheckBoX等控件时，直接点击子项无反应，分析发现原来是Button，CheckBoX等控件会优先获取焦点，那么子项点击的焦点就被上述控件抢走了，解决办法有以下两种 1.将ListView对应布局文件Layout内的所有子控件的android:focusable属性设为false 2.包含所有子空间的Layout的属性设置成如下方式android:descendantFocusability="blocksDescendants"这里我采取的是第二种方式，...

Android编程之Fragment动画加载方法源码详解

上次谈到了Fragment动画加载的异常问题，今天再聊聊它的动画加载loadAnimation的实现源代码：Animation loadAnimation(Fragment fragment, int transit, boolean enter,int transitionStyle) { 接下来具体看一下里面的源码部分，我将一部分一部分的讲解，首先是： Animation animObj = fragment.onCreateAnimation(transit, enter,fragment.mNextAnim);if (animObj != null) {return animObj;}开始的这部分，会调用Fragment...

【读书笔记-《Android游戏编程之从零开始》】4.Android 游戏开发常用的系统控件（EditText、CheckBox、Radiobutton）【代码】【图】

3.4 EditTextEditText类官方文档地址：http://developer.android.com/reference/android/widget/EditText.htmlEditText继承TextView，所以EditText具有TextView的属性特点，下面主要介绍一些EditText的特有的输入法的属性特点android:layout_gravity="center_vertical"：设置控件显示的位置：默认top，这里居中显示，还有bottomandroid:hin：Text为空时显示的文字提示信息，可通过textColorHint设置提示信息的颜色。android:single...

Android网络编程之获取网络上的XML【图】

Android网络编程之获取网络上的XML请尊重他人的劳动成果，转载请注明出处：Android网络编程之获取网络上的XML 为要获取网络上的XML所以需要服务器端提供的支持。一、创建服务器端：服务器端项目结构：服务器端运行效果图：第一步：创建业务所需的JavaBean package com.jph.server.model;import java.util.Date;/*** 新闻实体类* @author jph* Date:2014.09.26*/ public class News {private Integer id;private String title;priva...

Android 编程下设置 Activity 切换动画【代码】

为 Activity 设置切换动画我们知道，我们可以在 AndroidManifest.xml 文件中，通过 android:theme 属性设置 Activity 的主题。主题中定义了关于 Activity 外观的很多特性。同时，主题中还可以定义 Activity 的切换动画。这是应用 Activity 切换动画的一种方法。下面讲解一下如何通过主题来设置 Activity 间的切换动画。定义包含动画的 Activity 主题res/values/styles.xml，很简单，就是使用 windowAnimationStyle 这个属性，指定切...

《Android编程权威指南》CriminalIntent项目梳理【图】

相信很多新手或者初级开发人员都已经买了第2版的《Android编程权威指南》,这本书基于Android Studio开发，对入门人员来说是很好的选择，但是很可惜的是，在完成一个项目后，缺少对项目的一个大体上的梳理，本书在7-17章花了大量篇幅介绍CriminalIntent应用，所以这里在完成CriminalIntent之后，我在这里自己对项目进行梳理。介绍：CriminalIntent应用能记录陋习的标题，日期以及照片，也支持在联系人当中查找当事人，通过E-mail,T...

初学_Android4高级编程-2 Fragment

Fragment允许将activity拆分成多个完全独立封装的可重用控件。每个组件有它自己的生命周期和UI布局。(类似于一个嵌入在activity中的activity)通过继承Fragment来创建一个新的Fragment，大多数情况下，需要为Fragment分配一个UI(xml布局文件)，也可以创建一个没有任何UI的后台行为的Fragment。public class MyFragment extends Fragment{ //调用该方法连接它的父Activity @Override public void onAttach(Activity Activity){ 　　...

Android网络编程使用HttpClient访问web站点

HttpClientDemo.java界面就是两个按钮和一个文本框/** 用HttpClientlai 来访问提交请求，接收响应* A,发送GET请求* 1,创建HttpClient对象；HttpClient httpclient=new DefaultHttpClient();* 2,发送GET请求,创建HttpGet对象：HttpGet httpget=new HttpGet("http://www.baidu.com");* 3，用HttpClient对象实行HttpGet对象会得到服务器响应对象HttpResponse的对象，响应就封装在HttpResponse中：* HttpResponse httpresponse=httpcl...

一天掌握Android JNI本地编程快速入门【代码】【图】

一、JNI（Java Native Interface） 1、什么是JNI： JNI(Java Native Interface):java本地开发接口 JNI是一个协议，这个协议用来沟通java代码和外部的本地代码(c/c++) 外部的c/c++代码也可以调用java代码 2、为什么使用JNI：效率上 C/C++是本地语言，比java更高效代码移植，如果之前用C语言开发过模块，可以复用已经存在的c代码 java...

(转)android 蓝牙通信编程

转自：http://blog.csdn.net/pwei007/article/details/6015907Android平台支持蓝牙网络协议栈，实现蓝牙设备之间数据的无线传输。本文档描述了怎样利用android平台提供的蓝牙API去实现蓝牙设备之间的通信，蓝牙设备之间的通信主要包括了四个步骤：设置蓝牙设备、寻找局域网内可能或者匹配的设备、连接设备和设备之间的数据传输。以下是建立蓝牙连接的所需要的一些基本类： BluetoothAdapter类：代表了一个本地的蓝牙适配器。他是所...

【Android平台中的安全编程】の＃01-限制app的敏感ContentProvider的可访问性

本文翻译自https://www.securecoding.cert.org/confluence/display/java/DRD01-J.+Limit+the+accessibility+of+an+app%27s+sensitive+content+provider，有增删改。ContentProvider类提供了与其他app管理和共享数据的机制。当与其他app共享provider的数据时，必须小心的实现访问控制，防止对敏感数据的非法访问。限制ContentProvider的访问有三种方法：PublicPrivateRestricted access［Public］在AndroidManifest.xml文件中声明an...

ANDROID - 最热教程

Android的APP怎样制作LOGO的尺寸 Android开发处理内存申请失败的报错(F...App携带参数安装Android和iOS全面解析 angular2打包AndroidAPP环境搭建的方法 Android进阶--属性动画PropertyAnimati...Android客户端与PHP服务端通讯(四)-极光...Mac中Ionic+Cordova Android打包报错Co...android – 如何使用RxJava Observer而...Android List，Set，Map集合安全集合区...Android/Linux Thermal框架分析及其Gov...

首页 / ANDROID / android-GPU与CPU编程：处理时间不一致

android-GPU与CPU编程：处理时间不一致

内容导读

内容图文

内容总结

内容备注

内容手机端

【android-GPU与CPU编程：处理时间不一致】教程文章相关的互联网学习教程文章

Android 编程之入门开发文件夹管理器开发文件事件操作-2【图】

【读书笔记《Android游戏编程之从零开始》】16.游戏开发基础（动画）【代码】【图】

Android之网络编程利用PHP操作MySql插入数据（四）【代码】【图】

Android开发中网络编程与常见功能优化总结

Android编程心得-ListView子项点击无反应的解决办法

Android编程之Fragment动画加载方法源码详解

【读书笔记-《Android游戏编程之从零开始》】4.Android 游戏开发常用的系统控件（EditText、CheckBox、Radiobutton）【代码】【图】

Android网络编程之获取网络上的XML【图】

Android 编程下设置 Activity 切换动画【代码】

《Android编程权威指南》CriminalIntent项目梳理【图】

初学_Android4高级编程-2 Fragment

Android网络编程使用HttpClient访问web站点

一天掌握Android JNI本地编程快速入门【代码】【图】

(转)android 蓝牙通信编程

【Android平台中的安全编程】の＃01-限制app的敏感ContentProvider的可访问性

ANDROID - 相关标签

编程 - 相关标签

ANDROID - 最新教程

ANDROID - 最热教程