0. 问题描述

该问题产生于我在ptcharm中试图用cupy加速numpy计算，进行一些简单但是繁琐的数据处理，这个问题和cupy关系不大，cupy只要照着nvcc -v给出的版本号对应着下载就ok了
问题的本质是GPU代码的编译问题，因此pytorch等需要CUDA编译器（NVCC）的都有可能遇到这个问题
因为光顾着解决问题，没粘贴报错细节，报错信息其实很长，可以见这个帖子，我遇到的问题和他一样

1. 问题定位

问题定位到如下信息：

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\include\sm_32_intrinsics.hpp(124): error: asm operand type size(8) does not match type/size implied by constraint ‘r’

2. 解决方法

因为我是利用pycharm，不是自己手动在命令行进行编译，所以采用了这个神帖里给出的第二种解决方法：在cmd中执行：

C:\Program Files (x86)\Microsoft Visual Studio\2017\Enterprise\VC\Auxiliary\Build\vcvarsall.bat" x64

其实就是找到Microsoft Visual Studio文件夹下的VC\Auxiliary\Build\vcvarsall.bat这个东西，然后给它一个参数x64表示你是想要在64-bit环境下执行编译。
注意执行完上述命令关闭cmd之后重启一下pycharm，不重启的我多走了半天的弯路哭都没地哭QAQ
执行完上述命令后是这个样子：
如果你的问题没有解决，可以参照神贴下面另一个人给出的解决方法（都试试没坏处）
如果上述依然不能解决，可以看看自己环境变量里都设置对了没

3. 问题原因

怎么说，因为可能gcc或者什么很多是默认是32-bit进行编译，而nvcc基本都是64-bit（这个其实取决于你的电脑，一般都会下载64-bit）。很多项目包含了gpu代码和cpu代码（比如我用了cupy代替numpy的同时也用了一些cpu下的python包），nvcc编译gpu代码的时候默认是编译64位平台结果，然而cpu代码编译时可能使用了32位的编译器。
But所有非CUDA编译由通用的C编译器完成，cl或者gcc。导致这种“混编”容易因为位数不同导致上述问题的出现。
至于再细节的我看到了一些说是“对齐方式”不同导致的，或者是“寄存器设置”导致的。总之都是64位和32位的设置在打架
nvcc的编译可以参考这里

4. reference

https://blog.csdn.net/qq_42679415/article/details/124318003
https://stackoverflow.com/questions/12843846/problems-when-running-nvcc-from-command-line%5B/url%5D
https://blog.csdn.net/weixin_29022115/article/details/116587084?spm=1001.2101.3001.6661.1&utm_medium=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-116587084-blog-116786403.t0_edu_mix&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-116587084-blog-116786403.t0_edu_mix&utm_relevant_index=1

CUDA编译器nvcc可能遇到：error: asm operand type size(8) does not match type/size implied by constraint ‘r‘相关推荐

TypeError: Input 'b' of 'MatMul' Op has type float32 that does not match type int32 of argument 'a'.
执行如下语句报错 TypeError: Input 'b' of 'MatMul' Op has type float32 that does not match type int32 of argu ...
CUDA编译器nvcc的用法用例与问题简答
本文使用nvcc版本:Cuda compilation tools, release 5.5, V5.5.0 1.nvcc支持OpenMP 书写makefile时,使用-fopenmp命令选项时会报n ...
【Python】Error:Input 'y' of 'Add' Op has type float32 that does not match type int32 of argument 'x'.
学习Python,碰到数据类型不一致进行运算出现的问题,问题现象.原因.解决办法如下. 1.问题代码 # 引入 tensorflow 模块 import tensorflow as tf# 创建两个常 ...
检查CUDA的NVCC编译器和GPU加速卡
在安装好CUDA环境之后,初次使用CUDA之前还要检查编译器NVCC和GPU加速卡 1.检查CUDA的NVCC编译器是否安装正确: $ which nvcc 2.检查机器上是否安装了GPU加速卡 $ ...
nvcc(CUDA编译器)
nvcc就是CUDA的编译器 nvcc是10.0就代表你装了CUDA的版本是10,0. nvcc可以从CUDA Toolkit的/bin目录中获取,类似于gcc就是c语言的编译器.由于程序是要经过编译 ...
windows下的C++与cuda编译器位置
在windows下最常见的C++编译器为visual studio自带的编译器cl.exe 通常其所在目录为: C:\Program Files (x86)\Microsoft Visual Stud ...
矩池云上CUDA、nvcc、cuDNN相关操作汇总
本文汇总整理如何在矩池云上安装.使用CUDA .nvcc.cudnn的教程,后续还将不断补充,也欢迎大家在评论区提相关问题. 优质提问和反馈,将有机会获得矩池云算力豆激励- CUDA相关文章 CUDA ...
c语言 2059 语法错误,关于CUDA C 项目中“ error C2059: 语法错误:“” ”问题的解决方法...
该问题的关键在于理解CUDA项目中C\C++文件需要由c++编译器进行编译,而CUDA C的源文件需要由CUDA的编译器nvcc.exe进行编译. 发生该语法错误的原因是cu文件被C++编译器所编译, ...
QT之error: cannot bind non-const lvalue reference of type ‘CBaowen’ to an rvalue of type ‘CBaowen
问题描述:QT中自己编写了一个结构体变量CBaowen,报文中含有函数重载部分(如下所示), 之后定义一个队列变量 QQueue<CBaowen> queue; 当给队列变量赋值时que ...

CUDA编译器nvcc可能遇到：error: asm operand type size(8) does not match type/size implied by constraint ‘r‘