lambda

我干了什么 究竟拿了时间换了什么

2019-09-16-微博、头条、抖音热搜比较

头条+抖音=微博

Concat: github: lambda_xmu 数据来源:热搜神器 数据时间范围:因数据可得性,数据时间范围: - 微博和抖音:2019-06-06~2019-09-04 - 头条:2019-07-24~2019-09-04 Base Information APP 每日平均热搜量 每日平均r...

2019-09-14-微博热搜挖掘(Part II)

“年年岁岁花相似 岁岁年年人不同”

Concat: github: lambda_xmu 在2019-09-11-微博热搜挖掘(Part I)中分析了最近两年多时间微博的热搜的整体情况。这一篇主要按年份——分析每一年最热的是什么。 每年 TOP 热搜 毫无例外,每年最热的都是明星的分分合合。但有趣的是,每年都有一起新闻事件能进入TOP20:2017年最受关心的新闻是九寨沟地震;2018年是重庆公交坠江;2019年...

2019-09-11-微博热搜挖掘(Part I)

那些年上过的热搜

Concat: github: lambda_xmu 文章灵感来源:上万条数据撕开微博热搜“过度娱乐化”的真相 数据来源:热搜神器 数据时间范围:2017-05-09~2019-09-04 共 842 天 数据量:201378 条数据 网传微博热搜榜排序公式:(搜索热度+传播热度)$\times$话题因子$\times$互动因子 搜索热度以搜索量为基础, ...

2019-09-04-2019CCF-Work-Piece-EDA-Part2

离散制造过程中典型工件的质量符合率预测

Concat: github: lambda_xmu 赛题地址:离散制造过程中典型工件的质量符合率预测 EDA Part1: 2019CCF Work Piece EDA Part 1 在赛题中,只要删除Parameter1、Parameter2、Parameter3、Parameter4成绩会提升很多,但是为什么会提升很多,因此来看下不同的label在Parameter中的分...

2019-08-31-Data-competition-From-0-to-1-Part-II(补充)

特征工程小节

Concat: github: lambda_xmu 本文在包大人基础之上进行补充: PPT:Kaggle比赛的进阶技巧和国内比赛前十套路 视频:https://www.bilibili.com/video/av57480953/?p=2 特征工程 编码角度 类别特征: 频度统计count: 优势:可以解决长尾问题,将出现次数少的进行合并 ...

2019-08-27-2019CCF-Car-Sales-EDA

乘用车细分市场销量预测

Concat: github: lambda_xmu 赛题地址:乘用车细分市场销量预测 DATA BACKGROUD 历史销量数据包含32个车型在15个省份,从2016年1月至2017年12月的销量。参赛队伍需要预测接下来4个月(2018年1月至2018年4月),这32个车型在15个省份的销量。 注:从数据分析得到,车型共60种,而非32种;总共在22省份销售,而非15省份...

2019-08-25-2019CCF-Work-Piece-EDA

离散制造过程中典型工件的质量符合率预测

Concat: github: lambda_xmu 赛题地址:离散制造过程中典型工件的质量符合率预测 DATA BACKGROUD 在此任务中,以某典型工件生产过程为例,提供一系列工艺参数,以及在相应工艺参数下所生产工件的质量数据,来预测工件的质量符合率。 Label Distribution 可以对标签excellent,good,pass,fail依次赋值为1,2,3,...

2019-08-22-Data-competition-From-0-to-1-Part-II

Feature Engineering Techniques

Concat: github: lambda_xmu Introduction Feature engineering, the process creating new input features for machine learning, is one of the most effective ways to improve predictive models. “Com...

2019-08-20-Speed-Up-Python-Code

Numba Tutorial

Concat: github: lambda_xmu The Python library Numba gives us an easy way around that challenge — free speed ups without having to write any code other than Python! Introducing Numba Numba is ...

2019-08-15-Data-competition-From-0-to-1-Part-I

Credit Fraud Detector Example

Concat: github: lambda_xmu 1. Data competition Introduction A typical data science process might look like this: Project Scoping / Data Collection Exploratory Data Analysis Process(Dat...