其实昨天KDD就开始了,不过今天算是我跟KDD的第一天。
昨天夜里就短信跟中秋聊了一会儿,然后中秋说他一天都在弄数据库,连不上怒了。然后我跟他说明天我来。于是今天就在图书馆弄KDD,数据是用数据库存储的而
不是文件,数据库用的PostgreSQL,然后就在Linux上搭建PostgreSQL,没什么问题。就是最后在载入样例数据备份的时候数据一直下载
不下来,然后就到中秋哪里拿数据。
在中秋那里看了一下他的错误,其实没解决,我的感觉还是他的安装包的问题,貌似PostgreSQL对Windows支持并不太好,说安装有错误,读不了或者没有那个.conf文件,然后就在他的虚拟机上试了一下,果然就可以正常。
回图书馆之后在自己的机器上把拿来的备份数据导入之后就训练了一下,结果训练之后发现文件路径没修改,我已没能保存结果,然后就回寝了。
回厨房角写了一会儿编译器实在写不下去了,first集又出了问题,就是对于有左递归的文法不知道怎么求first集,所以就找伟杰问了下,讨论着,就看到
中秋下来找我了,然后之后果断决定编译器水过,不跟他玩了。接下来一直到一点多我们都在弄KDD,中秋下来找我因为他的系统让他弄坏了,删python3
的时候把很多依赖都给删了,不过我给他的建议还是新安装一个虚拟机或者双系统吧,因为以前那个太老了,正好这次机会。然后整晚上我们的内容就是把样例代码
的模型训练出来还有结果输出来。然后换成另个算法,也是scik-learn提供的算法接口,原版的算法是随机森林,我们给换成了优化梯度下降,结果也算
出来了,中秋说让我明天把出来的结果传上去评测一下,看看怎么样,因为测试样例我们只有测试数据没有答案,所看不出好坏还。中秋的意思是等看看结果,然后
研究一下他样例的输入输出,然后就开始设计算法了得。
今
天总的来熟就是对数据库这种东西刮目相看,原本以为数据库就是网站用的,没想到数据库正经的用途是真的用来组织数据,而且按照样例代码,所有特征的提取,
都是用的SQL语句,我才看到何所谓"数据库",SQL语句真正是用来干嘛的。数据存储的正经方式使数据库才对啊,而特征提取的正经方式是SQL才对啊,
这时候才想到SQL语句没好好学,才想到即使不做web,数据库对我们也很有用,当初见识太浅薄。
另外中秋还告诉我可以给Pad装一个GoodBook,是最好测阅读器,虽然Adobe是官方的阅读器,但是做得并不好,公认是GoodBook最好的了,然后我就想既然中秋大神都这么说,花钱买一款也是值得的。
2013.4.19 - KDD第一天
原文:http://www.cnblogs.com/SnakeHunt2012/p/3553048.html