搜索资源列表
bitonic
- 基于最新一代通用GPU--Geforce8800,在CUDA平台上开发的并行排序算法,是基于GPU的通用计算的应用程序的一个好的范例。-based on the latest generation of common GPU -- Geforce8800. CUDA platform in the development of the parallel scheduling algorithm, GPU is based on the calculation of the common appl
cppgpgpu-1.0
- 通用GPU计算越来越受欢迎了,原因在于GPU具有多个并行计算单元,这是在GPU上进行通用计算的CPP代码
GPU-speedup
- 针对LA在解决大规模优化问题时需要消耗大量的时间无法达到实时性的问题,结合GPU的高速并行性,本文提出了一种基于GPU(Graphics Processing Unit,GPU)加速的细粒度并行免疫算法。本算法借助CUJDA(Compute Unifled Device Architecture,CUDA)统一架构,将实现过程转化成CUDA线程块并行计算过程,使得免疫算法在GPU中加速执行,在取得较好的优化效果的同时,解决了细粒度并行的群体规模限制问题,提高了算法的运行速度。-Solution
cuda-GPU
- 本文详细分析了Tesla GPU图形与计算架构和CUDA统一计算设备架构,详细描述了如何对计算任务进行并行分解,并通过CUDA的双层并行编程模型映射到Tesla GPU上。 在本文的实现部分,以软件开发流程为主线,描述了如何利用CUDA实现模式识别中的三种常用算法-The paper analyzed the Tesla GPU computing architecture and CUDA graphics and computing devices unified architecture,
gpu
- 基于OPENCL并行计算接口。 To compile, the proper installation of OpenCL library is required。-Read a source file written in OpenCL, execute directly on GPU.
spmv_csr
- 稀疏矩阵的DIA/ELLPACK/COO/CSR/HYB表示形式,以及各表示形式下的稀疏矩阵乘法(稀疏大矩阵*矢量)的CUDA实现。对于矩阵中每一行稀疏元素个数较统一的情况,ELLPACK表示最佳,其次是HYB(ELL+COO)。 CUDA™ 是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™ 架构编写程序-Sparse matri
GPU
- 史上最全GPU学习资料整理,一天变为并行计算大神-The most complete in the history of the GPU learning organization of data
CUDA-code
- 本代码是CUDA C/C++编程入门者学习的,其中包括对GPU设备参数的获取代码,原子操作,流等代码。初学者掌握并行计算不错的入门程序-The code is CUDA C/C++ beginners to learn programming, including the GPU to get the code of the device parameters, atomic operation, flow, etc. code. Parallel Computing for beginners
advanced-function-tensorflow
- 使用tensorflow来实现更高级的功能,例如多gpu并行计算、tensorboard可视化-Tensorflow to use more advanced features, such as multi-gpu parallel computing, tensorboard Visualization