前言:在空间里回顾了我的2014,从生活、技术、家庭等各方面对自己进行总结剖析,也是给自己一个交代。也想在博客上专门写一篇2014年度菜鸟的技术路回忆录,但是因为各种事一再耽搁了,现在来写也就更显得不合时宜了,也就作罢了,反正码农的生活都是围绕着pc、代码转,绕不开整天敲敲打打的26个字母。
看着在园子的园龄单位从月变成年,翻翻过去写的博客从大数据到可视化以及一些零散分支,渐渐的发现,变化的时间,不变的是成长。
书归正传,这两天有看到阿里在举办一个天池大数据竞赛,仔细一看,做的是推荐算法。抱着一种求知欲和好奇的心态,我决定试试,权当学习。其实我对推荐这块是个小白,也不知道推荐方面有哪些经典的算法,但是通过这两天看来,大致地了解了推荐为何存在、推荐的意义和常用的推荐算法。关于这个竞赛,我想到的是两个点,一个是大数据,另一个就是推荐,理所当然的,我就想到了mahout。仔细一了解,mahout中已经集成了很多的推荐算法的分布式实现如UserCF, ItemCF, SlopeOne等等。
那么第一步就是配置mahout环境,我的环境是这样的,虚拟机中的hadoop、window下的cygwin,还有myeclipse下的mahout,具体的环境配置这里不再赘述,今天解决的问题有:
Myeclipse中的Debug模式下,进行调试时无法跳转到相应类,显示的是source not found以及Edit Source Lookup Path的提示;sql server2008中导入平面文件数据报错。
1.针对第一个问题,网上的大部分做法是:
第一种:右键项目->build path->configure build path->Source->Add Folder,然后将指定目录加入项目空间
第二种:点击Edit Source Lookup Path按钮,添加当前项目
经尝试,以上两种方法都不能解决我的问题,最后一通搜索,无意发现点击Edit Source Lookup Path按钮加入不应该是当前项目,而是jdk安装目录下的src.zip,从而成功解决问题,真正原因在于没有添加jdk的source包。这个src.zip就是jdk的类库源代码,编译后就是所需的类库,也就是jdk安装目录lib下的rt.jar,我们经常用到的String类、Object类、Math类、Set类等都在这里面。
2.sql server2008中导入csv数据报错,主要有几下几种报错或警告:
通过针对性的将相应属性修改类型后仍不能解决问题,后来发现通过点击导入向导中的“建议类型”,分分钟解决问题,并能根据已有数据赋予相应的数据类型。