大数据分析建模的历史
发布时间:2021-05-13 18:11:39 所属栏目:大数据 来源:互联网
导读:根据江门站长网 Www.0750Zz.Com报道 随着企业信息化的逐步深入,大量信息系统在企业中广泛应用,物联网、云计算、工业互联网等技术与企业经营生产紧密结合,设备运行、生产加工、测试试验等数据采集过程更加自动化,企业积累了大量的数据,包括产品销售数据
|
根据江门站长网 Www.0750Zz.Com报道
随着企业信息化的逐步深入,大量信息系统在企业中广泛应用,物联网、云计算、工业互联网等技术与企业经营生产紧密结合,设备运行、生产加工、测试试验等数据采集过程更加自动化,企业积累了大量的数据,包括产品销售数据、客户消费数据、客户行为数据、企业运营数据等,企业经营生产的各个阶段都可以被记录下来,产品销售的各个环节也被记录下来,客户的消费行为和网上行为都被采集下来,这些数据隐藏着大量的有价值的规律和信息,是企业的重要资产。
另一方面,传统的数据报表、即席查询等简单分析手段已无法满足企业对于深层次信息的挖掘需求,大数据融合、大数据分析、大数据挖掘等技术不断发展,漏斗分析、事件分析、行为分析、留存分析、属性分析等模型不断完善,神经网络、决策树、关联规则等挖掘算法不断成熟,基于Hadoop、HDFS的分布式存储技术以及基于Storm、Spark、MapReduce等分布式计算技术迅猛发展,为大数据分析处理及分析建模提供了坚实的技术支撑。
大数据分析建模步骤
企业开展大数据分析,首先应开展业务调研和数据调研工作,明确分析需求,其次应开展数据准备工作,即选择数据源、进行数据抽样选择、数据类型选择、缺失值处理、异常值检测和处理、数据标准化、数据簇分类、变量选择等,再次应进行数据处理工作,即进行数据采集、数据清洗、数据转换等工作,最后开展数据分析建模及展现工作。大数据分析建模需要进行5个步骤,即选择模型、训练模型、评估模型、应用模型、优化模型结构。
选择模型----训练模型-----评估模型----应用模型----优化模型
1. 选择分析模型:基于收集到的业务需求、数据需求等信息,研究决定选择具体的模型,如行为事件分析、漏斗分析、留存分析、分布分析、点击分析、用户行为分析、分群分析、属性分析等模型,以便更好地切合具体的应用场景和分析需求。
2. 训练分析模型:每个数据分析模型的模式基本是固定的,但其中存在一些不确定的参数变量或要素在里面,通过其中的变量或要素适应变化多端的应用需求,这样模型才会有通用性。企业需要通过训练模型找到最合适的参数或变量要素,并基于真实的业务数据来确定最合适的模型参数。
3. 评估分析模型:需要将具体的数据分析模型放在其特定的业务应用场景下(如物资采购、产品销售、生产制造等)对数据分析模型进行评估,评价模型质量的常用指标包括平均误差率、判定系数,评估分类预测模型质量的常用指标包括正确率、查全率、查准率、ROC曲线和AUC值等。
4. 应用分析模型:对数据分析模型评估测量完成后,需要将此模型应用于业务基础的实践中去,从分布式数据仓库中加载主数据、主题数据等,通过数据展现等方式将各类结构化和非结构化数据中隐含的信息显示出来,用于解决工作中的业务问题的,比如预测客户行为、科学划分客户群等。
5. 优化分析模型:企业在评估数据分析模型中,如果发现模型欠拟合或过拟合,说明这个模型有待优化;在真实应用场景中,定期进行优化,或者当发现模型在真实的业务场景中效果不好时,也要启动优化,具体优化的措施可考虑重新选择模型、调整模型参数、增加变量因子等。
![]() (编辑:我爱制作网_潮州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐
热点阅读



浙公网安备 33038102330565号