搜索
查看: 3931|: 0

大数据投资对传统投资是补充甚至是颠覆

[复制链接]

149

主题

5

回帖

554

积分

高级会员

积分
554
发表于 2014-9-12 15:33:51 | 显示全部楼层 |阅读模式
由南方基金、新浪财经和深圳证券信息公司三方联合编制的南方-新浪大数据100指数、大数据300指数在深圳交易所新大楼举办敲钟仪式及新闻发布会。南方基金总经理助理、权益投资总监史博在新闻发布会上表示,大数据投资是对现有投资的有效补充,补充基础上大数据投资做得好,有可能对传统投资会产生颠覆式的影响。

  以下为其发言实录:

  曹总、邓总以及各位新闻媒体的朋友,今天非常荣幸能够和大家交流一下对大数据投资南方基金的看法。   

  我们看传统的投资,传统的投资分成两大类,主动投资和被动投资,主动投资实际上又可以把它分成两大方向,一种是基于基本面的投资,一种是基于技术分析的投资,如果把传统投资统一一下,其实传统投资都是基于数据的投资。

  基于基本面的投资,统投资价值投资,基本面分析的投资者注重企业的经营数据的分析,企业的历史经营效率、企业的收入、企业的毛利率、净资产收益的水平,这些都是企业日常经营过程中产生的数据。

  技术分析注重投资过程中,不同投资额产生的数据,投资者共同产生交易量的数据,形成的股价变化的数据,这是技术分析面进行投资的基础。

  我们来看主动投资本质来讲依托的是数据,对数据进行分析,指数化投资把企业,根据它的市值情况和收入的情况进行选股,进行划分以后构建出指数、指数组合进行投资。传统的投资也是基于数据的投资,大数据时代我们要做投资应该说是对传统投资不断的补充甚至是超越。我们基于数据不仅仅是传统投资中的企业财务报表中的数据,不仅仅是企业投资者在投资过程中形成的股票交易量、股票的交易价格变化的数据。

  同时我们关注投资者对数据的反映,基本面的数据是否超越的投资者的预期,投资者是否会对交易的数据如何进行反映,对于公司相关的报表,投资者的观点是什么,都会产生新一轮的数据,基于对数据的反映。我们认为大数据投资是对现有投资的有效补充,补充基础上大数据投资做得好,有可能对传统投资会产生颠覆式的影响。

  我们收集历史上的数据,2005年一直到今天以来,资本市场、A股市场表现得有好、有坏,表现最好的是2006、2007年市场平均的收益率在100%以上,表现比较差的比如说2008年,市场下跌了63%,2011年下跌了22%,我们把历年超越市场30%的股票拿出来,这些股票数量有多有少,多的是2013、2011年2013年有810只,2014年有535只,少的时候2011年有77只,超越市场30%的股票,即便在市场最不好的2008年,超过市场30%的收益率也有1.09%,整个市场下跌了63%,能够超越市场30%的股票平均收益率仍然是这么多。2006、2007年市场比较好的时候,这些股票的收益率甚至可以达到300%以上。如果我们真的能够找到相对表现比较好的股票,市场表现好、表现差都能给投资者带来比较丰厚的收益。

  问题出来了,如何能找到表现比较好的股票?市场是由人形成的,由人的行为形成的,基于的数据不仅仅是企业的经营数据,不仅仅是市场的成交量数据、价格的数据,同时要了解整个市场的参与者对这些股票、对成交量、对股票价格有什么样的反映,这些反映往往只能通过现在的大数据进行体现。同时,我们看到随着数据量的增加,数据的分析难度也越来越大。

  南方想通过有效的量化平台,通过我们的量化股票投资的平台和新浪财经的大平台有效融合,通过有效的融合分析我们获得的大数据,随着数据数量的增加,对数据的分析来讲压力值越来越大了,如何能快速的分析数据,得出有效的结论,这种价值也会越来越高。南方的量化股票投资平台,传统来讲是基于价值成长和企业质量的因子,这些因子是会筛选股票的行业属性,筛选股票行业指标的数据以及筛选市场反映的数据,同时我们会把新浪财经的大数据也结合进来,新浪财经的大数据,我们会把个股的热度、市场报表和文章反映个股的情绪都结合进来。同时我们会找出股票的热度预期、成长预期、估值提升预期,这些预期将会影响股价将来的预期,把这些预期形成权重,对这些权重构成动态的调整,形成指数构成的基础。

  在指数的过程中,样本的选择空间是非常大的,全市场所有的股票中我们扣除三类股票,ST股票扣除以及*ST股票,上市不满一年的股票我们也扣除,至少在目前的情况下,上市不满一年数据量有些时候是不够充足,利用大数据分析偏差可能比较大。选股因子包括三大因子:一是企业的财务因子;二是大数据的因子;三是市场的驱动因子。财务因子包括最新的市盈率的指标,净资产收益率的情况,企业年度收入和净利润增长率,以及对这些指标变化的预测。市场驱动因子包括股票近期的换手率、波动率、股价变化率、成交量变化率。对于新浪大数据因子包括以下几个方面,新浪财经频道下的页面点击量,微博正负面文章报道,以及文章报道的影响。南方基金想利用自身强大的投资量化平台,把这些因子进行优化,优化权重后最终创造出我们的i指数。

  我们对i指数的历史收益和历史表现做了分析,2010年以来到现在,对于大数据的100权重指数和300指数进行回撤,我们对标的百发100都进行了比较分析,过去五年大数据100等权重的话,大数据100的等额收益是222.4%,大数据300有148.58%的收益率,百发有137.15%的收益率,沪深300(2438.358, 14.90, 0.61%)指数、深证100指数,中小板指(7628.278, 82.37, 1.09%)数和A股指数都是负的。

  我们想比较不同的大数据效果也是一致的,我用一个原理说一下,世界上存在一些集合,集合类的数据是无穷多的,比如说0到1之间有多少个小数,可以说是无穷多的,0.1,0.01、0.001,无穷多之间是否可以比较呢?也有数据是无穷多的,无穷多的数值也是可以比较的,数值再多也是可以比较的,0和1的无穷多比1和2之间的无穷多还要多,不同的大数据质量有可能是千差万别的,新浪的大数据质量在我们看来,财经数据里是非常优秀的,它不仅有新闻报道、事件报道的数据,而且有投资者对数据的反映,这种反映往往过去的时候我们认为关注度的反映,关注度的反映很重要,同时在投资过程中,正面关注和负面关注也是非常重要的。而微博的数据不断的可以看到关注度,而且能分出是正面的关注度还是负面的关注度,这对我们来讲是非常重要的一点。

  构建大数据的指数除了看历史收益以外,我们也对数据指数的波动性做了分析,所谓指数的波动性做这个分析最重要的要看风险调整后指数的情况,这个了数据分析我们做的下图比率做了计算,下图比率是指指数的预期收益率,减去无风险收益以后和指数波动的方差进行比较,数值越高认为你在同等风险下能创造收益的水平是越高的。

  按照我们回撤的下幅比例,大数据100的下跌指数是7.35%,300下跌是5.63,百发100的下跌幅度是5.03,其他的指数像A股指数、沪深300、中证100(2206.587, 12.47, 0.57%)都是负值。通过指数的风险特征我们可以看出,利用大数据不仅可以给投资者带来很好的收益,而且是风险调整较好的收益率,风险低同时收益比较高。新浪和南方基金共同构造的大数据i指数充满信心,我们南方基金也会推出大数据i指数产品,占领一席之地。

  在大数据时代,信息可能不再昂贵了,海量信息中获取信息将变得昂贵,希望南方基金和新浪携手共进,创造更好的投资产品,为广大投资者创造福利.

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-12-24 00:12 , Processed in 0.052055 second(s), 24 queries .

快速回复 返回顶部 返回列表