赶紧写完睡觉

好累,记一下今天的成果,然后赶紧睡觉

文本挖掘课程

今天上了文本挖掘课程,讲了一些统计语言模型的历史和简单的中文分词技术,然后使用jieba分词做了小练习:用lxml爬一些文章下来,然后分词,最后使用wordcould做词云。

爬文章
import lxml.html
from urllib import request
f1 = request.urlopen('http://news.baidu.com/').read()
lxf1 = lxml.html.fromstring(f1)
lxf1l = lxf1.cssselect('a.a3')
lxf1ls = [[l.get('href'),l.text_content()] for l in lxf1l]
#lxf1lspd = pd.DataFrame(lxf1ls)
for ls in [lxf1ls[0]]:
    ls1 = request.urlopen(ls[0]).read()
    lxls1 = lxml.html.fromstring(ls1)
    lxls1l = lxls1.cssselect('div > p')
    lxls1ltext = '\n'.join([x.text_content() for x in lxls1l])
    print(ls[1])
    print('----------------------')
    print(lxls1ltext)
    print('======================')
http://news.xinhuanet.com/politics/2017-09/27/c_1121734537.htm
词云
import jieba
from wordcloud import WordCloud
jtext = jieba.cut(lxls1ltext,cut_all=False)
wcjtext = '/'.join(jtext)
fp = r'C:\Windows\Fonts\simkai.ttf'
wordcloud = WordCloud(font_path=fp,background_color='white',scale=1.5).generate(wcjtext)
plt.figure(1,(10,10))
plt.imshow(wordcloud)
词云

大概就是这样了。

Python金融大数据分析

下课以后学了这个,感觉pythonpandas库太牛了,做数据分析必备。虽然之前用也在用这个库,但是从来没有系统的学习过,这次稍微看了看书,书上的一些高级用法让人眼前一亮。

从yahoo下载Google股价,计算收益率年化波动
import numpy as np
import pandas as pd
import pandas_datareader as web
import matplotlib.pyplot as plt
import math
import numexpr as ne
ne.set_num_threads(4)

goog = web.DataReader('GOOG',data_source='yahoo',start='2009-01-01',end='2017-01-01') # 用校园网有线连接
goog['Log_Ret'] = np.log(goog['Close']/goog['Close'].shift(1))
goog['Volatility'] = goog['Log_Ret'].rolling(window=252).std()*np.sqrt(252) # 年化
#%matplotlib inline
goog[['Close','Volatility']].plot(subplots=True,color=['blue','red'],figsize=(8,6),grid=True)
Google:2009-2017股价和收益率年化波动
使用numexpr加速numpy科学计算
import numexpr as ne
loops = 1000000
a = np.arange(1,loops)
%timeit r = 3*np.log(a)+np.cos(a)**2
ne.set_num_threads(1)
%timeit r = ne.evaluate('3*log(a)+cos(a)**2')
ne.set_num_threads(4)
%timeit r = ne.evaluate('3*log(a)+cos(a)**2')

10 loops, best of 3: 138 ms per loop
10 loops, best of 3: 61.4 ms per loop
10 loops, best of 3: 31.2 ms per loop

使用numexpr以后,速度翻倍,增加线程数量,速度再次翻倍。

%prun魔法函数代码分析
%prun r = ne.evaluate('3*log(a)+cos(a)**2')
代码分析
IPython的Latex
#%%
%%latex
\begin{equation}
S_T = S_0 e^{(r - 0.5\sigma^2) T + \sigma \sqrt{T} z}
\end{equation}
期权定价公式

Bravo!我一定要好好学python!

MineCraft比拼

想学Java,打算看看之前玩的游戏MineCraft的源码。
下面放几个链接:

http://hopper.minecraft.net/help/pixel-format-not-accelerated/
错误处理:我的电脑只有集显(独显的驱动坏了,不能更新),所以报错,看这个是因为使用Intel HD 3000的集显,太low,所以Java版本不能太高,之前一直用的jre1.8.0_144,降低到jre6就好了。

https://tieba.baidu.com/p/4421623213?red_tag=0927855031
https://tieba.baidu.com/p/4251510226?red_tag=1211872928
教你怎么看MineCraft的源码。Java太恶心看不下去......
http://www.modcoderpack.com/website/content/
反编译器的下载地址,对应好版本下载即可。

我用了原来的我的世界精灵客户端,和网易的客户端,发现网易代理超级卡。当然,如果使用集显,网易客户端不能使用过高版本的MineCraft,因为1.12的我的世界用的是jre8,降低到1.7.10就是用的jie7,jie7下渣渣集显启动成功。

用其他的非网易代理的盗版客户端时候,注意也要更改jre版本。如果改不了的,去%AppData%\Roaming\XXX\下找找java.list、config一类的配置文件,手动修改jre地址。这里XXX就是使用的盗版客户端的名字了(MCELF,MCLC什么的)。无奈,网易代理不给力啊,想玩win10自带的C++版MineCraft了。

睏=_=。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,650评论 18 139
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 172,052评论 25 707
  • 常用概念: 自然语言处理(NLP) 数据挖掘 推荐算法 用户画像 知识图谱 信息检索 文本分类 常用技术: 词级别...
    御风之星阅读 9,175评论 1 25
  • 很早就听说稻城亚丁这个地方了,自从电影《从你的全世界路过》开播之后,这个地方更火了也让很多人向往,我也是慕名而来。...
    浮云201708阅读 237评论 0 2
  • 第一个画面,卡尔参军父子对话,不管遇到什么困难,永不放弃。 不忘初心,坚持不懈。 第二个画面,在船上用游泳表现自己...
    宋双材阅读 247评论 0 0