在服务器上使用tensorboard,不能直接在本地访问,因此要设置host,具体的指令是:tensorboard --logdir=xxx --host xxx.xxx.x...
在服务器上使用tensorboard,不能直接在本地访问,因此要设置host,具体的指令是:tensorboard --logdir=xxx --host xxx.xxx.x...
以下题号如无说明表示在中文leetcode上的题号双指针:15(三数之和)
用python命令执行py脚本时,py脚本所在的路径会被加入到sys.path当中(而不是执行python命令的那个路径),但是os.getcwd()是执行python命令的...
transformers库的tokenizer在默认情况下,decode中有个参数clean_up_tokenization_spaces会设置成True,即如果一个toke...
linux和windows查看cuda和cudnn版本https://www.cnblogs.com/wuliytTaotao/p/11453265.html[https:/...
anaconda创建新环境时慢:镜像网址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/[https://mir...
在两列环境下让表格跨栏,只需要将\begin{table}改成\begin{table*}即可 解决表格内自动换行的问题:https://blog.modelworks.ch...
使用git进行https clone之后每次都要输入用户名和密码,十分繁琐,解决方法是使用(windows系统)git config --global credential....
基本的multiprocessing用法: 但是需要注意,这里的f需要是全局函数,否则会出现报错的情况,那么如何可以让f不是全局函数呢,可以参考下面的文章 http://lu...
四种不同的应用组件类型 Activity 服务 广播接收器 内容提供程序 Activity Activity 是与用户交互的入口点。它表示拥有界面的单个屏幕。 服务 服务是一...
算法能力 coding能力 efficiency communication
STL中常用的数据结构 文档链接:https://zh.cppreference.com/w/cpp/container vector map unordered_map s...
目前只能申请向openai申请GPT3的api,但是似乎现在申请人数已经达到限度了hh
GPT3 阅读笔记Language Models are Few-Shot Learners 核心思想:meta-learning不需要fine-tune调整模型参数三种setting直接进行...
Cross-lingual Language Model Pretraining 主要贡献:align distributions of sentences in a com...
Batch Normalization对一个batch的每个样本计算均值方差,然后进行normalization Layer Normalization对每一个feature...
Language Models are Few-Shot Learners 核心思想:meta-learning不需要fine-tune调整模型参数三种setting直接进行...