pycuda

详细了解用于大量3x3矩阵求逆的算法

我遵循以下原始帖子：<a href="https://stackoverflow.com/questions/55357826/pycuda-adapt-existing-code-and-kernel-code-to-perform

前端之家
2022-08-12 • 问答
如何在Anaconda 2019.10的Jupyter笔记本上运行pycuda？

我有一个使用NVIDIA Quadro卡的Ubuntu 16.04实例。我刚刚通过从anaconda网站下载安装程序来安装Anaconda 2019.10。<

前端之家
2022-08-12 • 问答
我正在尝试使用cuda和pycuda比较2 D字符串数组

当字符串元素相等时，请复制相同的字符串，否则在此类条目中将“ XXX”指定为新的字符串元素。 <

前端之家
2022-08-06 • 问答
试图遵守此代码，但失败并显示错误。使用此代码比较2d数组的元素

这是比较2d数组元素的cuda代码。但是在编译时会显示错误。我使用的是pycuda，我发布了我想实现的所有

前端之家
2022-08-03 • 问答
可以在PyCUDA中将int变量从主机传输到设备吗？

<pre><code> import pycuda.driver as cuda import pycuda.autoinit from pycuda.compiler import SourceModule import numpy as np

前端之家
2022-07-26 • 问答
我们如何访问CUDA中3D阵列的列？

<pre><code> mod=SourceModule(""" __global__ void mat_ops(float *A,float *B) { /*formula to get unique thread index*/

前端之家
2022-07-24 • 问答
configure.py：错误：无此类选项：--no-use-shipped-boost

我尝试使用<code>https://github.com/jkjung-avt/tensorrt_demos/blob/master/ssd/install_pycuda.sh</code>安装pycuda，因为我使用

前端之家
2022-07-14 • 问答
PyCUDA访问3d点数组中的点-查找每个点的邻居

给定一个3d点数组，我想在指定半径内找到该数组中每个点的邻居。这是我要实现的内核代码。</p

前端之家
2022-07-12 • 问答
工作线程中的TensorRT执行上下文无法正常工作或导致崩溃

我构建了此线程类以使用TensorRT运行推理： <pre><code>class GPUThread(threading.Thread): def __init__(self, engine_p

前端之家
2022-07-09 • 问答
内存分配顺序在PyCUDA的规则中是否重要？

我在CUDA统一内存[<a href="https://devblogs.nvidia.com/unified-memory-cuda-beginners/" rel="nofollow noreferrer">1</a>]上使用PyCU

前端之家
2022-07-08 • 问答
CUDA阴性阵列索引测试

由于在C语言中可以为负数组位置建立索引并超出数组范围，因此此代码可以编译并“运行”。 <pre><c

前端之家
2022-07-07 • 问答
python libs中的Cuda cuLaunchHostFunc等效项

我要使用Python驱动CUDA，我希望在发生内核和内存复制后运行的流中安排Python宿主函数异步运行。

前端之家
2022-07-02 • 问答
将GPU编程应用于Python Talib包装器

是否可以将gpu编程应用于talib包装器？像 <pre><code>@cuda.jit talib.MFI() </code></pre>

前端之家
2022-06-25 • 问答
PyCUDA内核针对特定计算返回不一致的除法结果

我正在尝试实现一个计算百分比平均值的内核。示例-取3D数组（在下面的代码中）块<code>[[2,4],[3,6

前端之家
2022-06-24 • 问答
是否可以使我的函数仅在GPU的一个线程（或内核）上运行？

对于大小为N * N的矩阵，我设计的函数应该被调用N ^ 2次，这就是为什么为了使用GPU加速代码，我想在一

前端之家
2022-06-22 • 问答
将数组传递到PyCuda卷积内核中会产生意外行为

我正在尝试使用PyCuda将高斯滤波器与图像进行卷积。我已经从PyCuda文档中获取了一些代码，并从在线页

前端之家
2022-06-19 • 问答
如何使用pycuda中的内存地址初始化GPU阵列？

我有一个c ++代码，可在GPU内存中提供图像数组输出。我想使用pycuda做进一步的处理和图像分析。我正在

前端之家
2022-06-15 • 问答
TensorRT多线程

我正在尝试通过python API使用TensorRt。我试图在所有线程都使用Cuda上下文的多个线程中使用它（一切都可

前端之家
2022-06-13 • 问答
使用Nvidia的TensorRT进行批处理

我将训练后的模型转换为onnx格式，然后从onnx模型创建TensorRT引擎文件。我使用下面的snnipet代码执行此操

前端之家
2022-05-28 • 问答
填满前进杯/ CUDF

应该可以使用cupy / cudf进行填充吗？这个想法是执行schimitt触发函数，例如： <pre><code># pandas version df =

前端之家
2022-05-23 • 问答
PyCUDA无法使用Cuda程序调整图像大小

我正在尝试使用PyCuda程序调整图像大小。 <pre><code> import pycuda.autoinit import pycuda.driver as drv from pycuda.c

前端之家
2022-05-22 • 问答
无法使用pip安装pycuda

我正在尝试安装PyCUDA模块以运行我下载的某些python脚本，但是尝试通过pip安装它不起作用。我在命

前端之家
2022-05-22 • 问答
如何使用TensorRT和PyCUDA仅测量GPU中的推理时间？

我只想测量Jetson TX2中的推理时间。我该如何改善我的功能呢？现在，我正在测量： <ul> <li> 图像从C

前端之家
2022-05-21 • 问答
Nvidia Jetson Nano上的TensorRT + PyInstaller。反序列化引擎导致loadKernel中的Cuda错误：3（初始化错误）

我有一个读取序列化<code>TensorRT</code>引擎的代码： <pre><code>import tensorrt as trt import pycuda.driver as cuda cu

前端之家
2022-05-20 • 问答
用pycuda和opencv读取并行图像

我有一个程序，每次迭代都读取图像： <pre><code>for h in range(H): for w in range(W): z = depth_map[h,w]

前端之家
2022-05-03 • 问答
推送/弹出pycuda上下文时出现CuPy错误

我正在使用 tensorRT 通过 CUDA 执行推理。我想使用 CuPy 来预处理一些我将提供给 tensorRT 引擎的图像。只要

前端之家
2022-05-02 • 问答
nvcc 致命：在 pyCharm windows 10 64bit 上使用 conda env 在 PATH python 3.8 中找不到编译器“cl.exe”

好吧，标题几乎总结了环境，也用 venv 尝试过，我已经通过终端安装了 pyCuda 和 cudatoolkit，并且在 Windows

前端之家
2022-05-01 • 问答
在 CUDA 中应用 Gauss-Jordan 反演

我正在尝试将矩阵求逆应用于给定矩阵，但内核仅适用于最大为 5x5 的矩阵。如果我使用任何维度

前端之家
2022-04-29 • 问答
pycuda - memcpy_dtoh，没有给出似乎已经设置的内容

我有一个非常简单的函数，我传入一个字符数组并进行简单的字符匹配。我想根据匹配的字符返回一个 1

前端之家
2022-04-28 • 问答
为什么在这个例子中 PyCUDA 比 C CUDA 快

我正在探索从 OpenCL 迁移到 CUDA，并做了一些测试来衡量 CUDA 在各种实现中的速度。令我惊讶的是，在下

前端之家
2022-04-26 • 问答

首页

下一页
末页