幸福花园,数据产品司理从零到一:数据产品才能模型构建,电动四轮车价格

本文为PMCAFF专栏作者田宇洲出品

笔者正在由电商产品司理转型数据产品司理,为了进步自己学习的功率,测验以这种输出驱动输入的形式,将自己学习的思路和学习内容同享给咱们,也期望能够与其他数据产品司理多多交流。

本文测验凭仗笔者的了解构建一套数据产品司理才干模型,作为自己未来学习的方向。本文共分四个部分,榜首部分,从招聘商场需馄饨馅求下手,看商场上的招聘高档数据产品司理都需求把握哪些硬实力;第二部分,结合一些数据产品司理的同享,收拾数据产品司理的朋友圈,由于交流者必定程度决议了需求把握多少“共通言语”;第三部分,构建数据产品司理才干模型,第四部分,详解一些数据产品常常触摸的概念和体系。

1

从招聘要求看才干要求

笔者在拉勾网和猎聘网上查找数据产品司理和高档数据产品司理,将岗位职责汇总收拾,招聘方关于数据产品司理的需求如下所示:

从上面的企业招聘需求能够看出,数据产品司理除了需求具有一些一般产品司理根底才干外,对数据剖析,商业智能,数据发掘等技能有着十分高的专业门槛。尽管数据产品司理也大黄鱼细分出运用方向,大数发掘方向,数据剖析方向,但为了愈加有用的一同,仍是有必要补全常识鱼香茄子的做法结构。数据产品司理多是数据剖析师和数据开发通过内部转岗完结的,笔者归于电商产品转运用方向数据产品,在发挥事务了解优势的一同,需求快速补全数据剖析相关常识,便于与对接搭档高效协作。

微聊

2

数据产品司理的朋友圈

从前剖析过AI产品司理模型,也是从产品司理的朋友圈说起,由于产品司理许多时分承当着和谐推动人物,也承当了部分”翻译官“的觉,将事务需求转化成不同的言语表达,找老板要资源,请开发写代码,叙说清楚页面规划要求,这个时分就需求产品把握不同分科中的一些”黑话“,让对方感觉你是自己人,数据产品司理也是相同的,咱们来看看数据产品司理的朋友圈,也有助于进一步了解数据产品才干模型。

源于《阿里巴巴数据产品司理作业(总结篇)》

数据产品司理实质是互联网产品司理的一个细分范畴,其产品的用户是公司内部,外部客户等,其方针是通过数据剖析和发掘,辅佐其发现问题,进步决议计划精确性,而为了完结这类产品,咱们不单要与传统的开发,交互,规划,用研,客户,测验同学打交道,还需求与数据剖析师,数据科学家,AI工程师,数据仓库办理员等同学交流,为了能够保证交流中的功率,咱们需求清楚交流时或许会涉及到哪些专业名词,技能完结鸿沟,职业开展状况,竞品完结逻辑,笔者将测验在后续文章中收拾总结。

3

才干模型构建

数据产品司理是产品司理岗位的一个细分范畴,其才干模型能够了解为一般产品司理才干模型+专业才干弥补模型。下图是腾讯产品司理才干模型体系,明晰界定了不同等级产品司理19个才干偏重方向,全体来看学习才干,执行力,交流才干,商场/用户调研与剖析是最中心才干。

以上19个根底才干模型中,数据产品司理在技能常识模块和商场剖析才干/前瞻性需求了解/了解/把握如下常识和技能:

a. 核算机言语层面:娴熟运用MySQL,SQL、Hive等言语;

b. 了解数据出产加工流程:数据收集,数据预处理,数据存美好花园,数据产品司理从零到一:数据产品才干模型构建,电动四轮车价格储,数据剖析,数据发掘,数据可视化,数据效劳产品化;

c. 需求了解的各类技能理论及开展趋势

4

数据产品司理常常面临的根底概念

a. 或许触摸到的英文缩写

数据仓库 Data Warehouse

数据集市 Data Mart

数据发掘 Data Mining美好花园,数据产品司理从零到一:数据产品才干模型构建,电动四轮车价格

DBMS:Database Management System数据库办理体系

DBA: Database Administrator数据库办理员

RDBMS:Relational Database Management System联系数据库办理体系

OLAP:(On-Line Analytical Processing)联机剖析处理。OLAP是数据仓库体系的首要运用,支撑杂乱的剖析操作,planbar偏重决议计划支撑,并且供给直观易懂的查询成果。

OLTP:(On-Line Transaction Processing)联机事务处理。OLTP是传统的联系型数据库的首要运用,首要是根本的、日常的事务处理,例如银行买卖。

BI: Business Intelligence 商业智能

KDD:knowledge discovery in databases 美好花园,数据产品司理从零到一:数据产品才干模型构建,电动四轮车价格数据库常识发现

b. 数据剖析,数据建模和数据发掘的界说和差异

数据剖析:An水浒传好词好句alysis of data is a process of inspecting, cleansing,美好花园,数据产品司理从零到一:数据产品才干模型构建,电动四轮车价格 transforming, and modeling data with the goal of discovering useful information, suggesting conclusions, and supporting decision-making.[源于wikipedia]能够看出,数据剖析着重运用核算学办法,发现有用信息,支撑决议计划,结构建设性定论。

数据发掘:Data mining is the computational process of discovering patterns in large data sets involving methods at the intersection of artificial intelligence, machine learning, statistics, an捍卫萝卜2d database systems. It is an interdisciplinary subfield 道德影院of computer science. The overall goal of the data mining process is to extract information from a data set and transform it into an understandable structure for further use.[源于wikipedia]数据发掘与大数据关联性愈加亲近,使用人工智能,机器学习,核算学等常识,关于大型数据集进行剖析,发现规则,猜测未来,辅佐决议计划。

数据建模:Data modeling is a石油 process used to define and analyze data requirements needed to support the business processes within the scope of corresponding information systems in organizations. Therefore, the process of data modeling involves professional data modelers working closely with business stakeholders, as魔王 well as potential users of the information system.[源于wikipedia]数据建模是对实际国际各类数据的笼统安排,确认数据库需统辖的规模、数据的安排形式等直至转化成实际的数据库。 建模进程中的首要活动包含:确认数据及其相关进程;界说数据;保证数据的完好性;界说操作进程;挑选数据存储技能。数据建模大致分为三个阶段,概念建模阶段,逻辑建模阶段美好花园,数据产品司理从零到一:数据产品才干模型构建,电动四轮车价格和物理建模阶段。其间概念建模和逻辑建模阶段与数据库厂商毫无联系,换言之,与MySQL,SQL Server,Oracle没有联系。

数据剖析和数据发掘的联系:梁小龙从数据量级来看,一般状况下,数据剖析的数据量或许并不大,而数据发掘的数据量极大。从建模条件来看,数据剖析是从一个假定动身,需求自行树立方程或模型来燕麦与假定符合,而数据发掘不需求假定,能够主动树立方程。从剖析目标来看,数据剖析往往是针对数字化的数据,而数据发掘能够选用不同类型的数据。从成果来看,数据剖析对成果进行解说,呈现出有用信息,数据发掘的成果不容易解说,对信息进行价值评价,着眼于猜测未来,并提出决议计划性主张。数据发掘与数据剖析两者严密相连,具有循环递归的联系。引荐阅览《数据剖析、数据发掘、数据核算、OLAP 之间的差异是什么?》

c. 数据库,数据仓库和数据集市的界说和差异

数据库:数据库是指长时刻存储在核算机内有安排的、可同享的数据调集。数据库中的数据按必定的数据模型安排、描绘和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户同享。数据库理论的研讨首要集中于联系的标准化理论、联系数据理论等。近年来,跟着人工智能与数据库理论的结合及并行核算机的开展,数据库逻辑演绎和常识推理、并行算法等理论研讨,以及演绎数据库体系、常识库体系和数据仓库的研发都已成为新的研讨方向。

数据仓库:数据仓库(Data Wareh地球的位面私运商人ouse) 是一个面向主题的(SubjectOri2ented) 、集成的( Integrate ) 、相对安稳的(Non -Volatile ) 、反映前史改变( TimeVariant) 的数据调集用于支撑办理决议计划。首要,数据仓库用于支撑决议计划,面向剖析美好花园,数据产品司理从零到一:数据产品才干模型构建,电动四轮车价格型数据处理,其次,数据仓库是对多个异构的数据源有用集成,集成后依照主题进行了重组,并包含前史数据,并且存放在数据仓库中的数据一般不再修正。

数据集市:为最大极限地完结灵活性,集成的数据仓库的数据应该存储在标准RDBMS(联系数据库办理体系R芒果不能和什么一同吃elational Database Management System) 中,并通过标准的数据库规划,以及为了进步功能而添加一些小结性信息和不标准规划。这种类型的数据仓库规划被称为原子数据仓库。原子数据仓库的子集,又称为数据集市。

数据库和数据仓库的差异:数据库是面向事务的规划,数据仓库是面向主题规划的。数据库一般存储在线买卖数据,数据仓库存储的一般广州旅行是前史数据。从时刻特色来看,数据库保存信息的时分,并不着重必定有时刻信息。数据仓库则不同,出于决议计划的需求,数据仓库中的数据都要标明时刻特色。

数据集市和数据仓库的差异:主张阅览文章《数据仓库和数据集市的差异》

d. 商务智能与大数据的概念及开展概略

BI(Business Intelligence)即商务智能,它是一套完好的处理计划,用来将企业中现有的数据进行有用的整合,快速精确地供给报表并提出决议计划根据,协助企业做出正确的事务运营决议计划。

商业智能的概念最早在1996年提出。其时将商业智能界说为一类由数据仓库(或数据集市)、查询报表、数据剖析、数据挖美好花园,数据产品司理从零到一:数据产品才干模型构建,电动四轮车价格掘、数据备份和康复等部分组成的、以协助企业决议计划为意图技能及其运用。而这些数据或许来自企业的CRM、SCM等事务体系。

干流商业智能产品:Tableau、saiku、kylin、BDP、growingIO、神策、阿里数加等。笔者正在阅览阿里巴巴的 《大数据之路》,后续将结合阿里数加产品收拾阅览心得。

大数据(big data),指无法在必定时刻规模内用惯例软件东西进行捕捉、办理和处理的数据调集,是需求新处理形式才干具有更强的决议计划力、洞悉发现力圭加偏旁和流程优化才干的海量、高增长率和多样化的信息财物。大数据的5V特色(IBM提出):Volume(很多)、Velocity(高速)、Va公主日记riety(多样)、Value(低价值密度)、Veracity(真实性)。大数据包含结构化、半结构化和非结构化数素描头像据,非结构化数据越来越成为数据的首要部分。

大数据的开展趋势:数据资源化,大数据与云核算深度结合,科学理论的打破,数据科学和数据联盟的树立,数据走漏众多,数据办理成为中心竞争力,数据质量是BI成功的要害,数据生态体系复合化程度加强。

e. 数据处理流程

需求剖析,数据收集,数据预处理,数据效劳产品化(模板化)。

数据产品需求剖析:向事务部门进行调研,了解事务需求处理的问题,将事务问题映射成数据剖析作业和使命,一同结合渠道已有才干,确认数据剖析或发掘计划。

数据收集:榜首步需求界说数据源挑选,DBA能够根据数据剖析需求,找到相关数据,树立一张数据宽表,将数据仓库的数据引进到这张宽表傍边,根据必定的逻辑联系进行汇总核算。这张宽表作为数据剖析的根底,然后再根据数据剖析需求衍生出一些不同的表单,为数据剖析供给洁净全面的数据源;

数据预处理:需求完结数据类型挑选,缺失值处理和异常值检测和处理,完结数据标准化;

数据效劳产品化:将结合阿里巴巴产品做详尽花呗提现剖析。

数据剖析 开发 技能
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。