股票信息分类系统

难点1:两只同领域的股票怎么建立联系

  1. (目前最可行)在某只股票的正面新闻、负面新闻链接到的页面中匹配该股票的竞争对手名称,如果匹配,返回该条新闻标题作为连接两只股票的节点

缺点:

  • 如此建立的联系可能会很少,无关点与有关点的比率可能达到20:1,可视化十分不美观

  • 需要对竞争对手名称进行处理,如"..省..市..有限公司",潜在工作量很大

  • 存在错判,如果A的正面新闻中恰好是包含其竞争对手B的负面新闻,怎么识别?(potential solution:反向搜索,在B中寻A,然而对应否?)

    1. 在某只股票的正面新闻、负面新闻链接到的页面中匹配语义学句子。
      如果匹配,返回该条新闻标题作为连接两只股票的节点

缺点:

  • 语义学句子不是简单的"是","包括",而是...什么?

可以为"平安银行等","平安银行相关","平安银行及","平安银行之类的"

  1. svm等机器学习方法分类,但是缺乏相应的股票知识,维数怎么确定?

一个设想是以各种关键词为维数,01分类,但是这样好像又回到了语义学问题上。

  1. 自然语言处理技术,短期内能学会吗。(potential solution:找自然语言的API)

难点2:数据量过大

潜在问题,属于第二阶段

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 《静》 郁尘 卧听风嘶吼 坐听鸟虫鸣 立听心跳声 听闻故人事烦心 剪不开 斩不断 她情丝万千 别把爱情在拨弄声响 ...
    郁尘丶阅读 106评论 0 0
  • 如今已经23岁了,可是真正的问自己,仍然分不清喜欢和爱的分界线到底在哪里,不懂什么才是喜欢,什么才是爱,真正的爱一...
    起个不深沉的名字阅读 366评论 0 0
  • 看了刘亦菲和吴亦凡的致青春,男主的演技拙劣无需多言,老套的角色设定,富二代,学习成绩优异,帮女主补习…… 最后的结...
    亭止阅读 111评论 0 1
  • 要问问自己因为什么而生恨,不妨问问自己爱着什么。可是我们的爱是那样脆弱无力,无法让自己得到拯救,反而一步步迈向沦陷...
    赵梓皓阅读 251评论 0 0
  • 在activity_main_layout里添加FragmentTabHost android.support.v...
    saronic阅读 148评论 0 0

友情链接更多精彩内容