数据类别不平衡怎么处理? 1.数据增强。 2.对少数类别数据做过采样,多数类别数据做欠采样。 3.损失函数的权重均衡。(不同类别的loss权重不一样,最佳参数需要手动调节) 4.采集更多少数类别的数据。 5.转化问题定义,将问题转化为异常点检测或变化趋势检测问题。 异常点检测即是对那些罕见事件进行识别,变化趋势检测区别于异常点检测,其通过检测不寻常的变化趋势来进行识别。 6.使用新的评价指标。 7.阈值调整,将原本默认为0.5的阈值调整到:较少类别/(较少类别+较多类别)。 阅读全文 → 2023-02-02
什么是模型的偏差和方差? 误差(Error)= 偏差(Bias) + 方差(Variance) + 噪声(Noise),一般地,我们把机器学习模型的预测输出与样本的真实label之间的差异称为误差,其反应的是整个模型的准确度。 噪声(Noise):描述了在当前任务上任何机器学习算法所能达到的期望泛化误差的下界,即刻画了当前任务本质的难度。 偏差(Bias):衡量了模型拟合训练数据的能力,偏差反应的是所有采样得到的大小相同的训练集训练出的所有模型的输出平均值和真实label之间的偏差,即模型本身的精确度。 偏差通常 阅读全文 → 2023-02-02
Linux系统和Windows系统的区别? Linux系统更稳定且有效率。 Linux系统是免费(或少许费用),而Windows系统是商业化主导。 Linux系统漏洞少且快速修补。 Linux系统支持多用户同时使用计算机。 Linux系统有更加安全的用户与文件权限策略。 Linux系统可以访问源代码并根据用户的需要修改代码,而Windows系统不能访问源代码。 Linux系统更能支持多种深度学习配套软件,但是windows系统能支持大量的视频游戏软件。 阅读全文 → 2023-02-01
有哪些常用的图像去噪算法? 空间域去燥:均值滤波器,中值滤波器,低通滤波器,高斯滤波,双边滤波,引导滤波,NLM(Non-Local means)算法等。 频域去燥:小波变换,傅里叶变换,离散余弦变换,形态学滤波等。 阅读全文 → 2023-02-01
算法工程师该如何看待硬件侧知识? GPU乃至硬件侧的整体逻辑,是CV算法工作中必不可少的组成部分,也是算法模型所依赖的重要物理载体。 GPU的相关知识 现在AI行业有个共识,认为是数据的爆发和算力的突破开启了深度学习在计算机视觉领域的“乘风破浪”,而其中的算力,主要就是指以GPU为首的计算平台。 GPU(Graphical Processing Unit)从最初用来进行图形处理和渲染(玩游戏),到通过CUDA/OpenCL库以及相应的工程开发之后,成为深度学习模型在学术界和工业界的底层计算工具,其有以下的一些特征: 异构计算: 阅读全文 → 2023-02-01
Python中的实例方法、静态方法和类方法三者区别? 不用@classmethod和@staticmethod修饰的方法为实例方法。在类中定义的方法默认都是实例方法。实例方法最大的特点是它至少要包含一个self参数,用于绑定调用此方法的实例对象,实例方法通常可以用类对象直接调用。 采用@classmethod修饰的方法为类方法。类方法和实例方法相似,它至少也要包含一个参数,只不过类方法中通常将其命名为cls,Python会自动将类本身绑定给cls参数。我们在调用类方法时,无需显式为cls参数传参。 采用@staticmethod修饰的方法为静态方法。静态 阅读全文 → 2023-02-01