CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 其它 并行运算 搜索资源 - host

搜索资源列表

  1. asyncAPI

    0下载:
  2. CUDA开发计算,异步计算接口。可以在主机与现存之间异步执行。来自NVIDIA SDK-CUDA development of computing, asynchronous computing interface. Can be asynchronous between the host and the existing implementation. From the NVIDIA SDK
  3. 所属分类:MPI

    • 发布日期:2017-04-06
    • 文件大小:2603
    • 提供者:tab
  1. SimpleMultiGPU

    0下载:
  2. 多GPU核协作运算,使用CPU作为host端,协同多GPU进程运算,并将计算结果返回CPU;有 C++AMP的官方文档-Multi-GPU collaborative computing core, using the CPU as host side, the process of multi-GPU collaborative computing, and the result is returned CPU has C++AMP official documents
  3. 所属分类:MPI

    • 发布日期:2017-04-04
    • 文件大小:193172
    • 提供者:ltx
  1. Sort

    0下载:
  2. 使用内存共享模型,将主机端数据,分散到各GPU进行排序,然后将各并行结果返回,统一处理。附有C++AMP官方说明模型文档。-Using shared memory model, the host-side data, distributed to each GPU to sort, and then returns the results of the parallel, unified handling. With C++AMP official descr iption model docu
  3. 所属分类:MPI

    • 发布日期:2017-04-05
    • 文件大小:180815
    • 提供者:ltx
  1. test

    0下载:
  2. 并行设计实验1。 实验一:远程服务器(SSH主机)操作(验证性实验)-Concurrent Design Experiment 1: the remote server (SSH Host) Operating (confirmatory test)
  3. 所属分类:MPI

    • 发布日期:2017-05-01
    • 文件大小:103609
    • 提供者:chenrenjin
  1. TEST1

    0下载:
  2. 并行程序设计 实验1远程服务器(SSH主机)操作(验证性实验)源代码-Parallel Programming Experiment 1 remote server (SSH Host) Operating (confirmatory test) source code
  3. 所属分类:MPI

    • 发布日期:2017-04-12
    • 文件大小:646
    • 提供者:chenrenjin
  1. Colfax-HOW-Day-01

    0下载:
  2. 介绍了英特尔至强处理器和英特尔Xeon Phi协处理器和讨论它们的功能和目的。我们也开始介绍便携式的,面向未来的并行编程和讨论在英特尔MIC架构的高性能的先决条件:线程的并行性,矢量化和优化的内存访问模式。本课程将介绍本地的规划模型英特尔Xeon Phi协处理器,允许重用代码的应用程序设计为通用的CPU。会议的实践部分演示了如何在Linux操作系统(OS)在主机上运行的操作系统间的协处理器,以及如何使用英特尔的编译器上运行的处理器的本地应用程序。-Intel Architecture In
  3. 所属分类:MPI

    • 发布日期:2017-05-04
    • 文件大小:21023
    • 提供者:黄雪
  1. Colfax-HOW-Day-02

    0下载:
  2. we focus on the usage of the Intel Xeon Phi platform as a coprocessor in the offload programming model. We talk about the explicit offload model based on compiler pragmas, explaining how to offload functions, local scalars and arrays of known size, a
  3. 所属分类:MPI

    • 发布日期:2017-05-04
    • 文件大小:41916
    • 提供者:黄雪
  1. cudaMallocAndMemcpy

    0下载:
  2. 在主机和设备之间复制--从“cudaMallocAndMemcpy”模板开始。 第1部分:为设备上的指标 d_a 和 d_b 分配内存。 第2部分:将主机上的h_a复制到设备上的 d_a。 第3部分:将设备从 d_a复制到 d_b。 第4部分:将设备上的 d_b 复制回主机上的 h_a。 第5部分:在主机上释放 d_a 和 d_b。 额外部分:用cudaMallocHost代替malloc来分配h_a。(Copy between host and device -- start
  3. 所属分类:并行计算

    • 发布日期:2017-12-21
    • 文件大小:6144
    • 提供者:p-yang
  1. myFirstKernel

    0下载:
  2. 启动内核--从“myFirstKernel”模板开始。 Part1:使用指针d_a为内核的结果分配设备内存。 Part2:使用1-D的1-D网格来配置和启动内核 线程块。 Part3:让每个线程设置一个d_a的元素,如下所示: idx = blockIdx.x * blockDim.x + threadIdx.x d_a [idx] = 1000 * blockIdx.x + threadIdx.x Part4:将d_a中的结果复制回主机指针h_a。 Part5:验证结果是否正
  3. 所属分类:并行计算

    • 发布日期:2017-12-21
    • 文件大小:6144
    • 提供者:p-yang
搜珍网 www.dssz.com