首页 首页 人工智能 查看内容

算法岗位做数据挖掘大多都是抽特征跑跑现成模型”

木马童年 2019-11-10 17:08 20 0

这句话,说起来很简单,看起来也很容易,但真的是这样吗?我列举几点,扩展一下上面这句话:1、label符合业务场景吗?label准确吗?能够校准吗?放在哪张表里,怎么正确关联特征?2、特征合理吗?预处理流程正确吗? ...

这句话,说起来很简单,看起来也很容易,但真的是这样吗?

我列举几点,扩展一下上面这句话:

1、label符合业务场景吗?label准确吗?能够校准吗?放在哪张表里,怎么正确关联特征?

2、特征合理吗?预处理流程正确吗?有效吗?特征会泄露标签信息吗?特征时间维度一致吗?

3、用什么模型?模型出来的结果有什么业务含义?该怎么定义合适的指标来判断模型的性能?

4、根据模型结果,怎么回调特征,参数?

还有很多。造轮子,在工业界的数据挖据流程当中真的不重要。

假设你很牛逼,造了个GBDT,但是你比xgboost在同一数据集下好上多少?一个点?两个点?快上几秒?在牛比的特征工程面前都没有太大意义。

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

业务场景 数据集
0