一只初学者,如何登顶野生动物识别挑战赛附代码腾讯云开发者社区

最近,HackerEarth举办的一项初学者深度学习挑战赛,落幕了。

比赛内容是,识别野生动物。

来自印度的本科生Abhishek Sharma登上了冠军宝座。

于是,他写了写自己的心得,给小伙伴们参考:

比赛数据集里有19,000张图,包含30个不同物种的野生动物。

动物的照片是在真实场景里拍摄的,姿势不同,背景复杂,光线、天气条件、视角、遮挡情况也不同。

比起这些容易造成混淆的因素,有些不同的物种,看上去并没有那么大的差别。

哪个类别的预测概率最高,图像就分给哪个物种。

评估指标:分类器的logloss。

拿到任务之后,要做的第一件事就是去看,以前有没有类似的问题,前人方法能不能借鉴。

少年发现,比赛数据集和ImageNet有不少交集。

那么,怎样利用它们之间的异同来改进现有的方法?

首先,本次任务里的未知 (Unknown) ,和ImageNet是非常相似的。

所以,可以用迁移学习,拿CNN做初始化或者做固定特征提取器。

一个区别在于图像尺寸,ImageNet里面的图像都是224 x 224像素,而动物识别任务里,图像要更大一些。

因此,要改进算法来处理大图。

熟悉问题之后,就先搭建一个简单的pipeline:从加载数据集,到训练,到验证。可以迭代几次。

19,000张图像里面,有13,000张属于训练集,余下6,000张是测试集。

数据集并不是很大,为了避免过拟合,少年做了以下几种尝试:

就是通过旋转、翻转、裁剪等这样简单的操作,把一幅图变成几幅。

这里,用了transforms_side_on随机旋转,翻转,还调了光。

深度学习网络里,最重要的超参数就是学习率。

程序猿用的是lr_find的方法,是fastai库里面提供的,用来找最优值。

这个方法是Leslie Smith提出的:刚开始训练的时候,学习率设得很低,然后给每个Batch的学习率做指数增长。

训练用的图像尺寸是324 x 324,因为这些图像在验证集上表现比较好。

少年也尝试了不同的批尺寸 (Batch Size),试到32的时候,GPU存储到了上限。然后,他就为学习率做了相应的微调。

用小图训练几个Epoch之后,就可以换大图 (450 x 450) 再持续训练几个Epoch。

这也是防止过拟合的一种不错的方式,在少年的logloss身上,产生了明显疗效。

少年训练了各种模型,比如resnet50,resnext101_64,inception_4,restnet152以及restnext101。然后,把它们给出的结果用加权平均整合到一起,就获得了榜首的高分。

但是,在把各种网络结合在一起的时候,这些统计就减分了。

二是,在瓶颈特征 (Bottleneck Features)上训练逻辑回归 (Logistic Regression) 。瓶颈特征,是进入全连接层之前,卷积层输出的最后结果。

这个方法,在Kaggle狗狗品种识别挑战赛里,效果很好,但在这里就不太行。

印度少年说,大家一定要尝试从各种不同的角度来看问题,不要放弃。

HackerEarth是一个编程技能的线上评测系统,也举办过许多编程比赛。

虽然,有些比赛奖金并不丰厚。不过,据说比赛成绩好的选手可能获得名企的推荐资格。

THE END
0.2025年的GT世界挑战赛北京亦庄站,有哪些看点?近日,官方宣布,2025赛季GT世界挑战赛亚洲杯,将会在北京迎来赛季收官之战。那么,这个比赛有哪些看点呢? 参赛车手阵容的专业水准堪称亚洲赛车界 “天花板”,汇聚了多位国际赛事冠军与本土顶尖精英。国际阵营中,兰博基尼 “绝对车队” 的瑞士车手 Edoardo Mortara 堪称 “街道赛王者”,四度问鼎 GT 世界杯的他擅长在狭窄jvzquC41yy}/fxsiejkek7hqo1gsvrhng1=689;9;9669B74;;;42
1.创赛入门常见30问解答,或许有你想知道的新苗、国创有立项经费,校外比赛也有奖金;学校认定的竞赛获得一定等级的奖项会发奖金,我们学校的竞赛奖金标准:哪些竞赛有学校奖金,学校奖金按什么标准发 抵课程学分、第三课堂分无忧 详细可见:一文认清浙财创新创业学分认定及课程学分转换、第三课堂分(zufe) jvzquC41dnuh0lxfp0tfv8|gkzooa=8;78;358ftvkimg8igvcomu86452?6;=:
2.《炙爱之战》冠军奖金有多少?能买杭州一套房,帮运动员自费比赛虽然节目没有具体透露“巨额奖金”的具体数目,不过根据第二期嘉宾的回答可以作为参考。 第二期节目,当问起来参加节目的原因之时,翟雨和张博厚提到是希望能够获得板式网球的训练基金,同时也可以借此推广板式网球。 而公韵岚和张立鹏说到参加节目的原因也是因为比赛训练的基金。 jvzquC41oq|jg7iqwdgo0lto1tkwkn|137<:;?;41
3.仝扬加洞登顶2023中高协锦标赛陈顾新荣膺2023中巡赛奖金王赛季奖金王陈顾新在今天的比赛中陷入挣扎,全天抓下2只小鸟,吞下1个柏忌和1个双柏忌。“今天真的是不在状态,对这场比赛还是有些遗憾,”陈顾新在赛后谈到,“明天凌晨我将去到沙特参与亚巡本赛季的最后一场比赛,接下来一段时间的重心肯定是为DP做准备,感谢中国高尔夫球协会带来的这一张DP世界巡回赛参赛卡。这个赛季jvzquC41yy}/epfiqnl/q{l0ep5ipn|uafkucrqu15830qyon
4.2024CBSA中式台球国际职业联赛国际精英赛竞赛规程|选手|资格赛|注:比赛奖金均为人民币税前金额,所有获奖选手由承办单位按照国家税收规定代扣代缴20%税金。“清台王”是在正赛期间连续清台(包含炸清和接清)数量最多的选手,如多名选手连续清台数量相同,则奖金平分。所有奖金将在比赛结束后15日内,发放至选手登记的银行卡账户。 jvzq<84m0uooc7hqo0io1jwvkerfa;844;<4;:6a:c=6;mh922714u}{y0nuou
5.阿里数学竞赛里,一个四次考进决赛的专升本学生大专三年,我靠参加各类竞赛,奖金大约拿了有五万块,后来专升本去了江苏应用科技学院读机械设计自动化专业。所以2020年再次看到阿里全球数学竞赛,我没有犹豫就参加了,往后我都没错过。这些年参加竞赛比下来,我觉得阿里竞赛的选题也比国内大多数比赛更前沿。比如全国大学生数学竞赛的考题,有些题目你可以凭直觉感觉出来,可以jvzquC41yy}/nrkgygkl0lto0et0j>4ctvodnn4fgvgjn7iqAcxuKmB44;734