-
cuda-gdb提供错误“警告:检测到Cuda API错误:返回了cudaLaunchKernel(0x7)”
我正在尝试调试cuda-gdb中的程序。我能够成功在主机(CPU)上运行的代码中设置断点,但是每当我尝试在 -
不知何故我的张量流不使用gpu,那么如何解决这个问题:?
我在jupyter笔记本上运行<code>tensorflow-gpu</code>。 今天,我运行相同的代码,但未使用GPU。 所 -
nvcc致命:无法打开输出文件
我在Windows上使用pytorch进行对象检测算法: 当我运行<code>ext/build.py build_ext develop</code>脚本时 来自< -
local_memory_overhead没有发生本地内存访问?
我正在使用<code>nvprof</code>分析CUDA内核,该报告报告<code>local_memory_overhead</code> <code>69.49%</code>,但是<code> -
无法在cuda内核中使用我的模板类
我以为我知道如何编写一些简洁的cuda代码。直到我尝试制作一个简单的模板类并在简单的内核中使用它 -
在conda tensorflow-gpu中的nvcc?
我正在使用conda版本4.7.12的Ubuntu 18.04。我遵循此<a href="https://docs.anaconda.com/anaconda/user-guide/tasks/tensorflow/" r -
链接静态库时编译CUDA代码
我有C代码<code>main_code.c</code>和<code>helper_code.c</code>。前者取决于某些CUDA代码<code>cuda_code.cu</code>,而后者 -
解决与构建Darknet的“ Debug x64”版本相关的错误(尤其是NVCC生成错误)
我已经成功构建了AlexeyAB的称为Darknet的C / C ++解决方案的“发布x64”版本。我正在使用Windows 10 Professional -
nvidia-smi:找不到命令,但是GPU工作正常
我试图在服务器中安装一些软件包,这需要对某些CUDA库进行一些更新。但是现在我最终得到了 <co -
禁止显示“无法动态确定堆栈大小”警告?
我收到CUDA警告说 <pre><code>ptxas warning : Stack size for entry function '_Z13a_test_kernelv' cannot be statically de -
tensorflow错误此文件需要ISO C ++ 2011标准的编译器和库支持
结果如下,我运行项目stylegan2,但是失败。所以我需要帮助。链接为<a href="https://github.com/NVlabs/stylegan2" r -
我可以使用仅主机功能覆盖CUDA主机和设备功能吗? 覆盖(虚拟)方法必须尊重覆盖方法的执行空间选择。
考虑以下程序: <pre><code>class A { __host__ __device__ void foo(); }; class B : A { __host__ void foo(); }; int m -
nvcc错误:使用bazel构建张量流时,“ cicc”以状态0xC0000005(ACCESS_VIOLATION)死亡
我正在尝试构建Tensorflow 1.14.0 dll。我正在使用bazel 0.24.1来做到这一点。我也使用cuDNN 7.1.4和CUDA 9.0。我希 -
CMake:通过NVCC传递编译器标志列表
我正在尝试编译一些CUDA,并且希望显示编译器警告。等效于: <pre><code>g++ fish.cpp -Wall -Wextra </code></pr -
运行stylegan2和_pywrap_tensorflow_internal.lib是必需的,我没有
当运行stylegan2时,发生了异常,指出“ _pywrap_tensorflow_internal.lib”不存在。 stylegan2将其描述为类 -
nvcc链接器中发现模板函数时出错
我以以下方式在标头中声明了该函数,并在关联的.cu文件中定义了它: <pre><code>template<typename T> -
nvcc生成无效的错误,编译JNI代码
<pre><code>retries</code></pre> 错误是: <pre><code>$ nvcc --version nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2 -
nvcc由于缺少类模板而无法编译面向对象的代码
我在使用<code>nvcc</code>编译CUDA代码时遇到问题。为了演示它,我创建了一个虚拟类来表示3D空间中的表面 -
nvcc如何使用多基因代码进行编译?
nvcc可以与多种源代码一起使用吗? nvcc vec_add.cu -o vec_add -gencode arch = compute_20,code = sm_20 -gencode ar -
如何禁用有关栈大小不确定的ptxas警告?
在编译CUDA设备代码时,您可能会收到错误(为了便于阅读,带有换行符): <pre><code>ptxas warning : Stac -
如何防止C ++猜测第二个模板参数?
我正在使用C ++库(<a href="https://github.com/robhz786/strf" rel="nofollow noreferrer">strf</a>),该库中的某个位置具 -
未能按预期在Visual Studio中使用nvcc来定义uint =“ unsigned int”
对不起,VS2013仍然存在,但我认为这不是问题。相同的代码可以在linux上正确编译。我假设我需要定义uin -
我正在尝试安装NVIDIA版本的工具包,并且收到诸如“ ...此声明可能没有外部“ C”链接“之类的错误消息。
我正在尝试安装外部提供的工具包的NVIDIA版本(对于此消息,该工具包无关紧要,这是有关如何使用nvcc -
将CUDA内核调用作为参数宏传递时,预处理器宏中的参数数量不正确
我有以下宏 <pre><code>#define TIMEIT( variable, body ) \ variable = omp_get_wtime(); \ body; \ variable = omp_get_wtime() - var -
如何避免NVCC与其他11种SM架构产生兼容性?
当我通过CMAKE在Jetson TX2上从源代码构建PCL库时,我得到了以下调试日志以及其他消息: <pre><code>-- CUD -
执行CUDA时如何在Google Colab中链接libsvm库? libsvm的正确链接标志是什么?
我正在使用Google colab,并且我想在我的项目中使用libsvm库。我下载并安装了libsvm。现在,当我使用!nvcc -
如何在CMake中链接到目标但局部修改某些属性?
我正在使用Visual Studio 2017,Windows 10,CMake 3.16。 我遇到的情况是,我的项目包含cuda <code>.cu</code>文 -
在现有的C项目中使用CUDA Thrust:编译错误
我正在尝试将以下基本代码(<code>radix_sort_128x.cu</code>)合并到现有的<code>C</code>项目中: <pre><code>#in -
使用nvcc / gcc
我有一个CUDA NSight项目,该项目可以很好地编译,但是突然间编译失败。上周我确实安装了一些系统更新 -
覆盖nvcc的标题搜索顺序
我有一个使用<a href="https://thrust.github.io" rel="nofollow noreferrer">Thrust</a>的CUDA项目。推力随CUDA工具包一起提