图片 4

客商分析,在股票市场为啥各类网址计算的出入资金数额不均等

图片 1

分析结论

  1. 根据下图的分析结果:
    (1)
    序号为3的数据F,M指标最高,表示这些客户是交易的次数,金额是最大,这些客户已经达到饱和,所以是需要进行保持的客户
    (2)序号为0的数据F,M指标次之,是需要进行重点发展的客户,上升空间比较大
    (3) 序号为4的客户,各项指标都比较正常,是需要进行重点挽留客户
    (4) 序号为1的客户,各项指标都是负的,为低质的客户

图片 2

分析结果.png

资金流,这个崛起于2008年前后的方法,虽然发展了十几年年,无论各大网站和软件如何发展完善,都无法复制当初的辉煌,我也在在2009年下半年,就基本停止了资金流的研究。

模型

识别客户价值最广泛的模型是通过下面的三个指标去衡量:

  1. 最近 消费 时间 间隔(
    Recency):是指用户在最近的一次消费离数据进行分析的时间的间隔
  2. 消费 频率( Frequency):是指用户在数据分析的区间,交易的次数
  3. 消费 金额( Monetary):是指用户在数据分析的区间,交易的总金额

通过上面三个指标识别 出高价 值 的 客户, 简称 RFM 模型。

那么,为什么网站统计的资金不一样呢?

验证结果

根据统计结果的分类,简单的通过各个分类的客户数以及该分类的客户的金额进行验证,通过该算法可以对客户进行分类,可以针对不同的客户群体进行不同的营销策略,从而达到做大做强。

图片 3

结论.png

最后,打个广告

图片 4

IMG_1324.JPG

总结:2009年1月后,上海交易所的原始数据全部暂停,据说有基金经理告到上面去了,后来各大软件公司,为了挽留存量客户,用机器算法模拟原始数据,但由于数据库已经拿不到了,所以各大算法得出的资金流出流入数据差距很大。

分析步骤

  1. 获取原始数据(专线一个月的客户的开单的数据)
    客户名称,交易时间,交易金额

  2. 对数据进行处理:
    (1). 最近 消费 时间 间隔(
    Recency)=数据统计截止时间-客户最后的交易时间
    (2). 消费 频率( Frequency)=统计客户在统计时间内的交易次数
    (3). 消费 金额( Monetary)= 统计客户在统计时间内的交易金额总数

  3. 对获取的三个数据进行标准差 标准化
    结果=(原始数据-均值)/方差

  4. 通过k-means聚类的算法,选取5个聚类对客户进行分析。
    机器学习中聚类指事先并不知道任何样本的类别标号,希望通过某种算法来把一组未知类别的样本划分成若干类别,这在机器学习中被称作
    unsupervised learning (无监督学习)

其实原因很简单,以前的资金流拿到的是上海证券交易所的一手数据,然后各大软件和网站再加工成通俗的资金流统计,而从2009年1月份开始,原始数据没有了。

没有了原始数据,各大网站和软件为了挽留客户,研发出模拟替代的资金监测模型,而这些模型天生就有局限性,比如同时999手的买单和1手的卖单,同时在同一时间段最后交易,有的交易软件统计是买单,有的交易软件统计的是卖单。机器监测,毕竟代替不了原始数据,所以造就了网站统计的数据不一样。

背景

由于中国地大物博导致了中国的物流目前没有像美国一样出现物流企业的巨头,目前很多物流公司还停留在人工开单,人工记账的阶段,比较好的公司就有一个软件进行管理平时的操作,但是也只是停留作为一个工具去使用,对于每天的积累的数据没有利用起来。不管对于什么行业,客户是最重要,下面通过数据分析区分不用的客户级别。

问:在股市为什么各个网站统计的进出资金数据不一样?