2011年07月21 - 搜索引擎+B2B平台+SNS网站=? 一个三不像网站。偏偏投资人需要这样一个三不像网站。从4月份开始组建团队。时间一瞬2个月过去了。做B2B需要的就是大工作量和时间,而做搜索引擎光分词这块就搞的头大

2011年02月12 - 现有一JSP页面,其中的一个超链接需要传递参数给一个Servlet,而这个参数的值是中文,那么怎么样传递给Servlet而不是乱码呢?解决方法: String value=new String(request.getParameter("paramName").getBytes("ISO-8859-1")"gb2312");思路:以ISO-8859-1编码的方式转换成字节数组,在以这个

2016年12月23 - 这里以中文分词为例: 在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一定的概率分布。因此输出符号的序列能够透露出状态序列的一些信息。隐马尔科夫模型一共有两组状态,三个矩阵: 隐藏状态:一个系统的(真实)状态可

2015年01月20 - 在用Java程序进行读写含中文的txt文件时,经常会出现读出或写入的内容会出现乱码。原因其实很简单,就是系统的编码和程序的编码采用了不同的编码格式。通常,假如自己不修改的话,windows自身采用的编码格式是gbk(而gbk和gb2312基本上是一样的编码方式)而IDE中Encode不修改的话,默认是utf-8的编码,这就是为什么会出现乱码的原因。当在OS下手工创建并写入的txt文件(gbk),