LeetCode 题解(持续更新)

本篇文章置顶,长期更新,用于记录日常刷题题解以及需要注意的tip。

阅读全文

NLP实践 基于注意力机制的文本匹配

文本匹配是一个宽泛的任务,只要是研究两端样本之间的关系,都可以将这个问题看成文本匹配的问题。常见的任务场景有:

  • 相似度计算,复述识别
  • 问答系统
  • 对话系统
  • 自然语言推理、文本蕴含识别
  • 信息检索中的匹配
  • 机器阅读理解

阅读全文

NLP实践 文本分类任务

文本分类是NLP中的一个很经典的问题,通过这个问题可以熟悉NLP在处理这类问题的一个大致的思路,达到快速入门的目的。

阅读全文

图像的去噪

噪声在图像上通常表现为引起较强视觉效果的孤立像素点或像素块。通常噪声信号与要研究的对象不相关,以无用的信息的形式出现,下面的任务就是将噪声部分消去,使其对图像的影响最小。

阅读全文

NLP模型finetune:GPT到Bert(三)

NLP模型的预训练方式有ELMO的方式,基于特征的融合,通过学习句子的上下文语境来判断句子中多义词的含义,解决多义词歧义的问题,从而提升模型的性能。

另一种更类似于图像领域的预训练方式为fine tuning模式,该模式有一个代表,即GPT网络。

阅读全文

NLP之transformer(二)

NLP任务的输入往往是一句话或者是一篇文章,他有几个特点:

  • 输入是一个一维线性序列
  • 输入是不定长的
  • 输入单词的相对位置非常的重要
  • 句子中的长特征对理解句子非常的重要(距离很远的词)

一个合格的特征抽取器应当很好的适配领域问题的特点,能够充分抽取数据中的特征。

阅读全文

NLP之Word2Vec(一)

NLP领域有着四个比较大的方向:

  • 文本分类
  • 序列标注
  • 文本匹配
  • 文本生成

在NLP里头,最细粒度的就是 词语,由词语组成句子,由句子组成文章继而表达一些语言层面上的含义。因此本文从NLP的根源问题 词语表达 开始讲起,即word2vec,NLP领域重要的预训练方法。

阅读全文

effective cpp(九)杂项讨论

2019/11/26 effective cpp 第九章 杂项讨论

这是这本书的最后一章,今晚应该就能够阅读完!在开始阅读之前,我想感慨一下,最后的几章难度太大,一知半解的看下来,我想原因是相关张章节的实践不多导致的,因此日后有需要要回来重新阅读它们,时间很快大概花了一个月的空闲时间来阅读这本书,收获满满!

这一章主要说了三个问题:编译器的警告要重视;C++标准库的一个总览;boost一个泛用性C++库的总览。

  • 53 条款:不要轻视编译器的警告
  • 54 条款:让自己熟悉包括TR1在内的标准程序库
  • 55 条款:让自己熟悉Boost

阅读全文

effective cpp(八)定制new和delete

2019/11/25 effective cpp 第8章 定制new和delete

C++在内存管理,垃圾回收机制上常常受到人们的讨论。下面这一章将讨论C++的内存管理例程。

  • 49 条款:了解new-handler的行为
  • 50 条款:了解new和delete的合理替换时机
  • 51 条款:编写new和delete时需固守常规
  • 52 条款:写了placement new也要写placement delete

阅读全文

effective cpp(七) 模板与范型编程

2019/11/19 effective cpp 第七章 模板与范型编程

C++ template最初是为了让我们建立类型安全的容器,如vector,list,map等等,后来随着越来越多的人用上模板之后,人们发现,template这种代码与其处理对象类型分离,彼此独立的风格很好,于是人们道出了模板元编程,template的作用越来越大。

阅读全文