还记得高中时如何计算向量的乘积吗?做数据分析的时候,经常会有一个匹配名字的场景。两个字符串,虽然可以进行比较,s但是不能进行计算。只有数,向量可以进行计算,把字符串映射成数,那会丢掉很多特征,毕竟数是一维的,自然而然我们想到把字符串映射成向量,通过计算两个向量的夹角来判断两个字符串的相似文本向量化这样将文本向量化可以保存字符串绝大数信息,但也会丢失信息,比如字符串里元素的顺序代码