JAVA解决文本长度问题-标准化文本向量 2010/04/12 后端杂文hidehai9条留言 根据IFIDF对文本进行分词权重标记后,因为文本的长度各不一样,这就导致文本向量的数值差距明显,为了解决这个问题,我们可以将向量的长度都标准化为1,计算IFIDF后,根据公式: 就是分别对文…