南极Python

发表于2022-05-29|深度学习笔记

解决过拟合的手段有很多，比如early stopping, dropout, weight regularization，然而，这些手段无法解决模型对于标签过度自信的问题：在标签有误时，容易导致模型学习到错误的内容。在普通的交叉熵函数中，只有预测正确的类别才会对损失作出贡献。标签平滑的思想是对标签target的onehot形式进行改造，使其取值不再是非0即1，这样，预测错误的类别也会对损失作出较小的贡献，从而迫使模型进一步学习不同类别之间的区别，避免了模型的过度自信。使用标签平滑，只需对标签target进行变换即可，其余部分和交叉熵的计算方式是一样的，平滑后的标签如下： $$y_{ls}=(1-\alpha)*y_{onehot}+\frac{\alpha}K$$ 其中，K是类别数，$\alpha$是平滑系数，$y_{onehot}$是原始标签的onehot结果。标签平滑的PyTorch代码实现如下： 12345678910111213141516171819import torchimport torch.nn.functional as Fdef...

鲸鱼和海豚识别竞赛解析:上分思路

发表于2022-05-20|数据竞赛

数据backfin：只保留目标的背鳍特征(通过检测的方法得到的)，有点类似人脸关键点的作用。数据增强使用：颜色增强： random_hue random_saturation random_contrast random_brightness 几何增强： random_flip_left_right 离线增强：使用显著性目标检测去掉背景，得到无背景(背景变为白色)图片。统计这些图片中白色背景占比，并将占比低于某个阈值的图片取出来，添加到训练集中。模型 EfficientNet-B5/6/7 效果相比ConvNext和SwinTransformer要好一些，且b7>b6=b5...

PyTorch中的collate_fn有什么作用?

发表于2022-05-08|深度学习笔记

在使用PyTorch创建自定义数据集时，通常是先使用数据和标签定义一个DataSet类，然后将其传入DataLoader，这样就定义好了一个数据加载器。对于一些简单的任务，以上操作已经足够了。但有些时候，还需要自定义DataLoader类中的collate_fn方法。 DataSet类中定义了获取单个样本的方法(自定义__getitem__)，DataLoader类中定义了获取一个batch个样本的方法(相当于多次执行__getitem__)，将这一个batch的样本数据传入DataLOader类中的collate_fn方法，使用collate_fn中定义的逻辑对着一个batch的样本数据做进一步的处理。下面以目标检测为例，进一步解释自定义collate_fn的必要性。假设batch...

鲸鱼和海豚识别竞赛解析:验证&预测代码

发表于2022-05-07|数据竞赛

本文的目标是对整个验证和预测的过程进行梳理，至于其中出现的一些概念，比如GeM Pooling，ArcFace等，将在后续出一篇文章进行介绍。导入所需库12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849import osimport gcimport cv2import mathimport copyimport timeimport random# For data manipulationimport numpy as npimport pandas as pd# Pytorch Importsimport torchimport torch.nn as nnimport torch.nn.functional as Ffrom torch.utils.data import Dataset, DataLoaderfrom torch.cuda import amp# Utilsimport joblibfrom tqdm import...

鲸鱼和海豚识别竞赛解析:训练代码

发表于2022-05-07|数据竞赛

在上一篇文章中，我们已经介绍了赛题背景，目标任务，数据集格式以及评估指标，现在，来看看如何使用所给数据训练一个模型，来识别每张图片所对应的individual_id。本文的目标是对整个训练过程进行梳理，至于其中出现的一些概念，比如GeM Pooling，ArcFace等，将在后续出一篇文章进行介绍。导入所需库1234567891011121314151617181920212223242526272829303132333435363738394041424344454647import osimport gcimport cv2import mathimport copyimport timeimport random# For data manipulatiimport numpy as npimport pandas as pd# Pytorch Importsimport torchimport torch.nn as nnimport torch.optim as optimimport torch.nn.functional as Ffrom...

鲸鱼和海豚识别竞赛解析:全流程概述

发表于2022-05-06|数据竞赛

...

交叉验证时划分数据的方式

发表于2022-01-15|深度学习笔记

交叉验证是机器学习中常用的一种策略，其核心是对数据集进行划分，本文介绍sklearn中的3种交叉验证时划分数据集的方法： 123KFoldStratifiedKFoldGroupKFold 这里来举例说明各个方法的使用。先来导入这些方法，并创建一个简单的数据集： 12345from sklearn.model_selection import KFold,StratifiedKFold,GroupKFoldx=[1,2,3,4,5,6,7,8,9,10]# 特征y=[0,0,0,0,0,1,1,1,1,1]# 标签group=['a','a','a','b','b','b','b','c','c','c']# 样本所在的组 KFoldKFold只需要特征x就能够完成数据划分 123kf = KFold(n_splits=3,shuffle=True)#...

Kaggle竞赛:宠物吸引力预测

发表于2022-01-15

目标检测:Two-stage

发表于2021-12-28|深度学习笔记

RPN寻找每一个anchor匹配到的GT box，所以是多对一(不一定每个anchor都能找到匹配的GT box，原因见第三行) 假设有m个GT box，n个anchor，则有一个mxn的矩阵M, M[i,j]代表第j个anchor与第i个GT box之间的IOU anchor和GT...

ToothSeg项目总结

发表于2021-12-03|深度学习笔记

项目目标是打造一款牙齿分割器，它可以将一张人脸露齿图分割成共3个类别：上牙，下牙以及其他。采集露齿微笑的图片作为样本，每个人通过摆出不同嘴型来贡献多个样本。在剔除牙齿比较模糊的图片后，总共得到2000+样本，使用labelme进行标定。将标定好的数据处理成PascalVOC格式。按照8:2划分训练集和验证集，基于DeepLabV3+搭建baseline. 输入网络的图片是512*512的。数据增强：随机翻转随机旋转随机模糊中心随机裁剪 mIoU=0.8638. 修改网络结构：参考fpn的思想，原先的网络只使用了backbone提取的特征图的高层信息和低层信息，我们把中间层的信息也提取出来，自上而下的进行特征融合(插值上采样，求和或拼接)，代码实现在decoder模块中。 mIoU=0.874，有提升。将交叉熵损失改为Focal Loss，mIoU不升反降，由于调参花费时间会较长，因此不用Focal...