摘要
近年来,深度学习技术已广泛应用于皮肤病变识别。然而在实际应用场景中,单一医疗机构存在训练数据有限、有标签样本不足,以及集中式学习易泄露隐私等问题。针对上述问题,本文提出了一种基于联邦半监督学习的皮肤病变智能识别机制。具体地,设计了一个基于联邦学习的云边协同皮肤病变智能识别模型,该模型在保护用户隐私的前提下,协同训练各个医疗机构数据,可为用户提供准确便捷的诊断服务。接着,设计了一种面向数据异构的半监督损失函数,以有效控制局部模型与全局模型之间的差异。此外,通过融合多重随机采样与准确率加权方法,明确各个本地模型的贡献,并将各个不均匀的本地模型聚合成一个全局共识模型,以进一步降低数据异构的影响。最后,实验结果表明,相较于近期提出的几种机制,所提机制在性能和可扩展性方面表现更优。
Abstract
In recent years, deep learning technology has been widely applied in skin lesion recognition. However, in practical applications, single medical institution faces problems such as limited training data, insufficient labeled samples, and the risk of privacy leakage in centralized learning. To address the above problems, a federated semi-supervised learning-based intelligent recognition mechanism for skin lesion is proposed. Specifically, a federated learning-based cloud-edge collaborative intelligent recognition model for skin lesion is designed, which collaboratively trains data from various medical institutions while protecting the privacy of users. This model can provide users with accurate and convenient diagnostic services. Then, a semi-supervised loss function for heterogeneous data is designed to effectively control the difference between local models and global model. In addition, by combining multiple random samplings and accuracy-based weighting method, the contribution of each local model is clarified, and all uneven local models are aggregated into a global consensus model to further reduce the impact of data heterogeneity. Finally, experimental results show that the proposed mechanism has better performance and scalability than several recently proposed mechanisms.
Keywords
皮肤病是最为常见的疾病之一,而恶性皮肤病变,如黑色素瘤,是导致全球皮肤病相关死亡病例的主要原因[1]。据2023年美国癌症协会的年度报告,预计2023年美国将有约10万名新确诊的黑色素瘤患者,且患者数量正逐年上升[2]。早期诊断对黑色素瘤患者的生存率至关重要,研究表明在早期阶段被诊断出来的患者5年生存率可达90%以上[3]。反之,若黑色素瘤在早期未被诊断出来,致死率极高,患者五年生存率通常低于15%[4]。因此,及早发现和诊断恶性皮肤病变对于减少患者死亡率具有重要意义,同时也带来了巨大的诊断需求。
由于皮肤病变具有种类繁多、外观相似、类内差异大、分布不平衡等特点,精确识别皮肤病变一直是一个难题。近年来,随着人工智能的快速发展,深度学习在许多领域取得了卓越的性能。研究者们将深度学习应用于皮肤病识别领域,所提出的方法较传统的皮肤科医生具有巨大优势[5]。
尽管当前基于深度学习的皮肤病识别方法取得了良好的性能,但仍存在一些挑战。数据是深度学习的基础,训练数据的质量与数量都会影响模型的训练结果。大规模高质量的皮肤病变数据是训练深度学习模型的关键,但是目前大多数公开可用的皮肤病变数据集规模较小,这限制了深度学习模型的性能和泛化能力。其次,在医疗领域,随着隐私保护相关的法律不断完善,医疗机构之间无法共享患者数据,使得各大医疗机构数据中心成为一个个数据孤岛。由于训练样本不足,单一医疗机构训练得到的诊断模型往往性能较差,无法满足皮肤科医生的辅助诊断以及患者的初步筛查需求。
为了充分利用现有各大医疗机构的数据资源,同时在保护隐私的基础上实现数据共享,为皮肤病变模型训练提供丰富的数据源,本文引入了联邦学习技术。
目前,联邦学习已经在智慧医疗领域被广泛应用。2016年,McMahan等[6]首次引入了基于数据并行的联邦学习概念,并提出了联邦平均(Federated averaging,FedAvg)算法。作为一种去中心化的机器学习方法,FedAvg允许多个客户端共同参与训练一个机器学习模型,同时将数据存储在本地。在FedAvg框架中,由于用户的敏感数据不需要上传到中心服务器,因此避免了大规模的隐私泄露风险。FedAvg通过聚合本地模型参数,实现了基本的隐私保护与数据安全。Liu等[7]提出了一种基于联邦学习的自然语言处理方法,并在患者表征学习和肥胖共病表型两个任务上取得了良好的结果。Brisimi等[8]提出了一种基于联邦学习的软间隔正则化支持向量机分类器,通过联合分布于各个客户端的电子健康记录中描述的病史,预测心脏病患者未来的住院情况。Boughobel等[9]提出了一种基于联邦学习的不确定性感知学习算法,通过减少模型聚合过程中具有高不确定性的模型的贡献,在早产预测任务上取得了比FedAvg更好的结果。
上述方法没有考虑到实际场景中各个客户端可能存在数据异构问题。在实际应用中,不同客户端的训练数据通常具有非独立同分布的特点,这也被称为数据异构。在数据异构环境下,由于不同客户端的本地模型之间存在较大的差异,如果直接使用这些模型参数进行聚合,往往难以得到一个令人满意的全局模型。目前,有许多研究者针对数据异构提出了新的联邦学习方法,其中,具有代表性的方法大概有三类:基于数据的方法、基于聚合优化的方法以及基于个性化的方法。
1)基于数据的方法:基于数据的方法旨在通过修改数据分布来解决数据异构问题。Zhao等[10]在所有的客户端之间全局共享一个小规模数据集;Yoon等[11]交换各个客户端更新后的模型参数及其经过平均处理的样本数据;文献[12]提出了一种融合生成对抗网络的联邦学习方法,虽然上述基于数据的方法可以显著提高模型在异构数据上的性能,但是这些方法中的大多数需要依赖于数据共享,这会增加数据隐私泄露的风险。
2)基于聚合优化的方法:除了基于数据的方法,还有许多方法聚焦于联邦学习聚合策略的优化。Hu等[13]利用知识蒸馏技术来提取所有客户端异构模型的更新信息,并在服务器上训练一个辅助模型来实现参数聚合;Ye等[14]通过评估本地客户端的图像质量和计算资源设定聚合权重;Chen等[15]通过优化量化误差函数的收敛速度上限来为不同客户端分配不同的聚合权重;文献[16]还提出了一个基于部分模型聚合策略的联邦学习方法,服务器每一轮仅等待适当数量的本地模型。上述方法在数据异构环境下通过优化聚合策略提升了联邦学习性能,但是此类方法并未提供针对特殊客户端的个性化解决方案。
3)基于个性化的方法:针对上述方法存在的问题,研究者们开始探索个性化的联邦学习方法,即根据每个参与者的特定需求和环境来调整训练过程。Chang等[17]提出了一种鲁棒的联邦学习方法,通过上传特征而不是本地模型参数来实现本地个性化。文献[18-19]提出了一种基于个性化层的联邦学习方法,该算法允许每个客户端的神经网络模型拥有个性化层。Huang等[20]提出了一种基于注意力消息传递机制的联邦学习方法,使拥有相似数据的用户可以更好地协作。上述个性化方案提高了联邦学习在异构数据上的性能,但是由于其需要考虑不同客户端之间的差异并选择合适的模型结构和算法,因此其可扩展性差也是一个亟需解决的问题。
上述三类方法虽然有效提升了数据异构环境下联邦学习的性能,但是它们只考虑了有监督学习,即本地客户端的私有数据都是有标签的。然而,在实际应用场景中,对所有数据进行标注是不现实的。为解决这一问题,部分研究者提出了一些联邦半监督学习方法。例如,Yang等[21]引入联邦半监督学习来对肺炎Computed tomography(CT)胸片进行分割。Jeong等[22]提出了一种联邦半监督学习方法FedMatch,通过计算客户端间的一致性损失,最大限度地提高不同客户端模型之间的一致性。然而,这些方法并没有考虑本地客户端的数据异构问题,在数据异构环境下表现较差。
针对上述挑战,本文提出了一种基于联邦半监督学习的皮肤病变智能识别机制,主要贡献如下:
首先,本文设计了一个基于联邦学习的云边协同皮肤病变智能识别模型,通过该模型,各大医疗机构可以协同训练卷积神经网络模型,解决了单一医疗机构训练样本不足的问题,同时避免大规模的隐私泄露风险。接着,提出了一种基于联邦半监督学习的皮肤病变智能识别机制,所有客户端都由有标签样本与无标签样本组成,每轮训练会随机选取客户端从中心服务器下载全局模型参数用于本地的半监督学习,该机制可以充分利用无标签样本,解决了本地客户端有标签样本不足的问题。接着,设计了一种面向数据异构的半监督损失函数,对有标签样本采用交叉熵损失函数,对无标签样本则利用伪标签计算损失,同时引入了L2正则项,可以有效控制本地模型与全局模型之间的偏差来加快全局模型收敛,从而进一步提高全局模型性能。此外,该机制还对客户端进行多次随机采样以形成一个全局共识模型,解决了由本地模型之间偏差太大导致的全局模型性能下降的问题。同时,在每轮随机采样的全局子模型聚合阶段,引入准确率加权方法,在中心服务器中设置小规模的验证数据集,当中心服务器接收到客户端上传的模型参数时会利用该验证集测试模型的准确率,并根据模型准确率为其设置权重,明确各个本地模型的贡献,从而进一步提升全局模型性能。最后在ISIC 2018分类数据集①上的实验结果表明,本文所提机制与其它现有机制相比,取得了更好的分类性能,同时其可扩展性也明显优于其它现有机制。
1 网络模型
本节构建了一个基于联邦学习的云边协同皮肤病变智能识别模型,该模型由四个部分组成:用户层、边缘层、云层与样本源层。图1显示了这四个组成部分之间的关系。用户通过采集设备采集皮肤病变照片,将照片上传至边缘层的诊断服务器以获取诊断结果。边缘层包含多个边缘节点(医疗机构),各个边缘节点使用样本源提供的训练样本进行训练,每隔一定训练轮数将本地模型参数上传至中心服务器。此外,各个边缘节点还提供皮肤病变诊断服务。由于联邦学习的模型聚合操作需要大量计算资源,因此将联邦学习框架的中心服务器部署在云层,其作用是聚合本地模型参数以得到全局模型。样本源层由各个边缘节点的本地私有医疗数据组成,提供用于模型训练的脱敏数据。此外,边缘节点定期从云层下载用户上传的病例样本以及对应标签来扩充训练数据集。
1)用户层:用户层主要包括两类用户,皮肤病患者与皮肤科医生。针对两类用户,边缘节点可以提供两种不同的服务。对于普通患者而言,患者可以将皮肤病变照片上传至客户端来生成诊断服务请求;然后,边缘节点会处理患者的请求并返回服务响应,患者收到服务响应后即可下载诊断结果。由于普通患者通常使用手机、相机等终端设备来采集皮肤病变照片,此类照片受光照、角度、清晰度以及毛发等因素影响较大,边缘节点给出的诊断结果精度可能会受影响,但诊断结果可以作为患者的初步参考。同样地,当皮肤科医生有辅助诊断需求时,可以通过皮肤镜等专业设备采集患者病灶照片,然后将病灶照片上传至边缘节点,获得由边缘节点返回的诊断结果。皮肤镜可以清楚的拍摄到皮肤病变的特征,且受光照、清晰度等因素影响小,因此模型给出的诊断结果较为精确,可作为皮肤科医生诊断的参考,边缘节点反馈的诊断结果可帮助皮肤科医生为患者提供更为精确的诊断服务。
2)边缘层:该层主要由多个边缘节点组成。将各个医疗机构中的本地服务器视作客户端,其主要功能有三个:①训练本地模型,在训练开始前,云层的中心服务器向各个本地客户端发送初始模型,各个客户端利用样本源提供的训练样本对初始模型进行训练得到本地模型,然后将本地模型上传至中心服务器以参与协同训练;②存储训练好的模型;③提供皮肤病变诊断服务,当客户端接收到诊断请求时,将诊断请求中的皮肤病变图片输入至存储的模型以获取诊断结果。
图1基于联邦学习的云边协同皮肤病变智能识别模型
Fig.1Federated learning-based cloud edge collaborative intelligent recognition model for skin lesion
3)云层:云层由中心服务器、样本存储两个部分组成。其中,中心服务器聚合本地客户端上传的模型参数,并更新全局模型,将全局模型参数分发给各个客户端令其更新模型。此外,对于模型预测结果置信度高于一定阈值的样本,云层会存储该诊断结果及原始图片。对于预测结果置信度低于阈值的图片,云层会定期将此类图片发送至医疗机构校正,经过校正的样本再由医疗机构返回给云层。最后,通过诊断获取的新样本会作为训练数据集的扩充。
4)样本源层:样本源层由各个医疗机构的本地医疗数据组成,为客户端提供本地训练样本,本地训练样本主要包含三个部分:①国际皮肤成像合作组织提供的开源数据集;②由皮肤镜等专业设备采集并经过专业人员标注的皮肤病变图像;③由患者上传并经过专业人员标注的皮肤病变图像。
此外,医疗机构还为云层提供样本校正服务。具体地,对于云层发送过来的预测结果置信度低于阈值的样本,医疗机构将对其进行标注,并将样本及对应标签返回至云层用于数据集扩充。最后,医疗机构会定期从云层下载标注过的病例样本用于丰富本地训练数据集。
2 基于联邦半监督学习的皮肤病变智能识别
2.1 联邦半监督学习框架
在联邦半监督学习场景下,本文假设联邦半监督学习框架包含的客户端都由有标签样本与无标签样本组成。设有N个客户端C={C1,C2,...,CN},本地客户端有S个样本,包括T个有标签样本以及S-T个无标签样本。设有标签数据集为DL={Xi,Yi}Ti=1,无标签数据集为DU={Xi}Si=T+1。
本文提出的联邦半监督学习框架如图2所示。在第t个通讯轮次开始前,首先随机抽取J个本地客户端,然后,被选中的本地客户端从中心服务器下载全局模型参数θtglobal,并使用FixMatch算法[23]对模型进行本地训练。训练结束后,中心服务器根据被选中客户端模型的验证准确率来设置其权重,然后使用这些权重聚合所有被选中的客户端模型,以获得全局子模型。以上步骤重复K次后,对得到的K个全局子模型进行最后的聚合,得到第t轮的全局模型θt+1global。
图2联邦半监督学习框架
Fig.2Federated semi-supervised learning framework
2.2 本地训练策略
在第t轮开始时,所有被选中的本地模型使用当前的全局模型θtglobal进行初始化。同时,所有本地客户端均采用FixMatch一致性正则化方法进行训练。
FixMatch是一种半监督学习方法,其执行流程如图3所示。FixMatch的训练过程由有监督训练和无监督训练组成。对于有标签样本,使用标准的交叉熵损失函数ls执行有监督训练。ls公式如下:
(1)
其中,B为有标签样本的批大小,pb为有标签样本的真实标签,pweakm模型对弱增强有标签样本的预测概率分布。
对于无标签样本,FixMatch首先求模型弱增强样本的预测概率分布qweakb,当且仅当预测结果高于预设置的阈值τ时才能生成伪标签=argmax(qweakb)。对于强增强样本,输出的预测结果和对应弱增强样本得到的伪标签做交叉熵损失,得到无标签样本的损失函数然lu。lu公式如下:
(2)
其中,μB为无标签样本的批大小。为弱增强样本生成的伪标签,qstrongm为强增强样本的预测概率分布。
综上所述,FixMatch的损失函数为ls+λulu,其中λu是一个超参数,表示无标签样本损失的相对权重。
2.3 面向数据异构的半监督损失函数
在数据异构场景下,由于原始FixMatch损失函数未考虑客户端之间的数据异构性,因此随着通信轮次的增加,本地模型很有可能逐渐偏离全局模型,导致全局模型难以收敛甚至性能下降。为了解决这一问题,本文在原始FixMatch损失函数中引入L2正则项,通过控制本地模型与全局模型的偏差来加快全局模型收敛,从而进一步提高全局模型性能。
第t个通讯轮次中,当客户端i被中心服务器选中时,中心服务器将当前轮次的全局模型θtglobal发送给客户端C,然后引入L2正则化计算θtglobal与客户端C当前本地模型θtC的距离。由此得到的L2正则项为
(3)
综上所述,本地客户端的损失函数由两个部分组成,一个是原始FixMatch损失函数ls+λulu,另一个是引入的L2正则项。因此,本文设计的面向数据异构的半监督损失函数可以记为
(4)
其中,ρ为超参数,用于控制L2正则项的大小。
图3FixMatch流程图
Fig.3Flowchart of FixMatch
2.4 融合多重随机采样与准确率加权的模型聚合
为了从数据异构环境中获得性能优秀的全局模型,本文设计了一种融合多重随机采样(Multiple random sampling,MRS)与准确率加权(Accuracy-based weighting,ABW)的模型聚合算法用于聚合本地模型参数。具体地,该算法对所有客户端进行多次随机采样,并用ABW对选中的模型进行聚合得到全局子模型。这两个步骤重复K次后,将K个全局子模型聚合得到每轮的全局共识模型。MRS与ABW具体执行流程如下。
1)MRS:在第t轮开始时,随机选择J个客户端,然后,服务器将全局模型θtglobal发送给被选中的客户端,然后在客户端上执行本地训练。上述操作执行K次。为了节省通信成本,如果同一客户端在同一通信轮次中被重复采样,中心服务器不再向该客户端发送全局模型参数。
2)ABW:传统联邦学习训练方法FedAvg根据本地客户端数据集的样本数量来设置权重,但是在数据异构环境下,客户端数据集样本数量并不能直接反映该客户端模型的性能好坏。因此,为了更好地评判本地模型的性能,更准确地反映出每个客户端对模型的贡献,以对贡献更大的模型赋予更高的权重,本文将根据模型准确率来设置权重。具体地,在训练前,中心服务器先准备一个小规模的验证数据集。在中心服务器接收到所有被选中的客户端模型参数后,它会将这些模型参数设置到临时模型中。然后,中心服务器依次通过验证数据集测试临时模型的准确率。最后,中心服务器根据本地客户端对应的临时模型准确率为其设置权重,设置权重的公式如下所示:
(5)
其中,wi表示第i个客户端的权重,acci表示第i个客户端模型的验证准确率,accj表示第j个客户端模型的验证准确率,J为选中的客户端数量。
那么在第t轮,第k次随机采样的全局子模型为
(6)
其中,wkj与分别表示在第t轮的第k次随机采样操作中,第j个客户端的权重与模型参数。
最后,执行完K次随机采样操作后,中心服务器聚合K个全局子模型来更新全局模型:
(7)
第t轮全局模型θt+1global的详细更新过程如算法1所示。
算法1 融合多重随机采样与准确率加权的模型聚合算法
3 实验结果与分析
3.1 数据集与超参数
本文使用ISIC 2018分类数据集[24]对模型进行训练与评估。ISIC 2018分类数据集是国际皮肤成像合作组织发布的大型皮肤镜图像数据集,它由10 015张皮肤镜图像构成。该数据集有七个类别皮肤病变:黑色素瘤(Melanoma,MEL)、黑色素细胞痣(Melanocytic nevus,NV)、基底细胞癌(Basal cell carcinoma,BCC)、光化性角化病(Actinic keratosis,AK)、良性角化病(Benign keratosis,BKL)、皮肤纤维瘤(Dermatofibroma,DF)与血管病变(Vascular lesion,VASC)。样本分布如图4所示。
图4ISIC 2018分类数据集各个类别的数据分布
Fig.4Distribution of various classes in ISIC 2018 classification dataset
数据集按照7∶2∶1的比例随机划分为训练集、测试集以及存储在中心服务器用于测试客户端模型准确率的验证数据集。为了节省计算资源,将所有图像的尺寸调整为224×224。
根据Dirichlet分布Dir(α)(α=0.75)将训练数据集划分成非独立同分布数据集分区并分发给不同的客户端,使得每个客户端的训练样本满足非独立同分布。客户端数量设置为10。每个客户端的数据集都只有10%的样本是有标签的。
本文采用ResNet-34作为本地客户端的训练网络。损失函数中的τ设置为0.95,λu设置为1,μ设置为7,B设置为8,ρ设置为0.001。本地训练采用随机梯度下降(Stochastic gradient descent,SGD)优化算法与warmup学习率调整策略。
3.2 评价指标
本文使用准确率(Accuracy)与精度(Precision)对所提出的机制进行准确评估。准确率与精度的计算公式如下:
(8)
(9)
其中,TP,TN,FP,FN分别为真阳性、真阴性、假阳性、假阴性。
3.3 实验结果对比
MRS中有两个重要的参数:每个通信轮次的随机采样操作次数K以及每次采样选中的客户端数量J。为了更好地了解参数K与J的取值对全局模型准确率的影响,本文进行了不同K与J取值的消融实验,结果如图5所示。由图5可知,K×J的大小与模型性能成正比。然而,K×J越大通信开销也越大。因此,在后续实验中,本文对模型性能与通信开销进行了权衡,即设置K=3,J=4以平衡二者之间的关系。
图5不同K与J的取值对模型准确率的影响
Fig.5Effect of different values of K and J on model accuracy
为了验证本文提出方法中MRS与ABW的有效性,本文进行了消融实验。如图6所示,本文对比了基本方法、融合MRS的方法、融合MRS与ABW的方法的实验结果,其中,基本方法采用FedAvg的聚合策略。由图6可知,融合MRS与ABW的方法比基本方法效果更好,这证明了MRS与ABW的有效性。
图6融合不同模块对模型准确率的影响
Fig.6Effect of integrating different modules on model accuracy
为了评估本文所设计的面向数据异构的半监督损失函数的有效性,图7显示了模型在融合MRS与ABW的情况下,采用不同损失函数的训练样本准确率随着通信轮数的变化。从该图可以看出,随着通信轮数的增加,两个模型的准确率不断提高。然而,采用本文所设计的损失函数的模型在通信轮数达到80时就开始收敛,并且在收敛后取得的准确率也高于采用原始FixMatch损失函数的模型。这表明所设计的损失函数可以有效提高全局模型的收敛速度,同时提升全局模型的准确率。
图7训练准确率随着通信轮数的变化
Fig.7Change of training accuracy with the communication rounds
如表1所示,本文对比了不同训练方法取得的模型准确率与精度,本地客户端均采用FixMatch进行训练。由表1可以看出,集中式学习取得了最高的准确率,比本文方法高2.6%,同时其精度也高于本文方法。尽管集中式学习训练的模型性能略优于联邦学习方法训练的模型,但是集中式学习有很大缺陷:由于中心服务器需要存储各个客户端的数据以进行集中式训练,一旦服务器被攻击者攻陷,很容易导致大规模的隐私泄露,对患者造成不可逆的损失。由于神经网络训练需要充足的训练样本,而单一客户端训练样本不足,单一客户端本地训练的模型难以获得令人满意的分类性能,仅取得了61.9%的准确率以及65.7%的精度。相比之下,联邦学习不需要收集各个客户端的训练数据进行集中训练,而是通过聚合各个客户端的本地模型参数,使得各个客户端可以共享全局信息,共同参与模型训练,从而有效提升模型性能。
表1不同训练方法的准确率与精度对比
Table1Comparison of accuracy and precision of different training methods
表2显示了本文所提出方法与现有联邦学习方法的分类性能对比。本文提出的方法取得了最高的准确率与精度,分别为77.8%与80.7%。FedAvg根据本地客户端的训练样本数量为客户端模型设置权重,然后按照权重聚合本地模型以获得全局模型,它取得的准确率为75.2%,精度为78.1%。基于FedAvg,FedProx[25]在本地训练过程中引入了近端项,以约束本地模型的更新大小,缓解了本地模型在迭代次数过多后容易偏离全局最优的问题。FedProx取得了76.3%的准确率以及78.9%的精度。上述两个方法虽然取得了较好的模型性能,但在本地模型聚合方面还有提升空间。与上述两种方法不同的是,本文提出的方法不是直接聚合本地模型,而是通过MRS对客户端进行多次随机采样,以缓解不同客户端之间模型偏差过大的问题。此外,上述方法仅根据本地客户端训练样本数量设置客户端权重的方法不能有效反映各个客户端对全局模型的贡献。由于客户端之间数据分布不同,有时样本量大的客户端训练的模型性能并不一定高。本文提出的方法引入ABW,即基于客户端模型准确率的加权方法来为客户端设置权重,明确各个客户端对全局模型的贡献,提升全局模型训练效果。最后,本文还将L2正则项引入FixMatch原始损失函数,以控制本地模型与全局模型间的差异,从而进一步加快全局模型收敛速度,提升全局模型性能。因此,通过融合MRS,ABW以及所设计的面向异构的半监督损失函数,与现有方法相比,本文所提出的方法取得了显著的性能优势。
表2不同联邦学习框架的准确率与精度对比
Table2Comparison of accuracy and precision of different federated learning frameworks
图8描绘了不同联邦学习方法的准确率与客户端数量之间的关系对比。对于不同客户端数量,本文对通信开销与模型性能进行权衡,将超参数K×J按比例进行相应调整。本文方法将超参数K×J设置为3×2,3×4,3×6和4×6,分别对应客户端数量为5,10,15以及20的情况。从图中可以看出,本文提出的方法取得了最高的准确率,进一步证明了其优势。当各个客户端的样本总量保持不变时,随着客户端数量的增加,每个客户端的样本量减少,客户端之间的异构性也随之增加,这导致了全局模型性能下降。尽管如此,与其它两种方法相比,本文方法的准确率变化幅度更小,性能更加稳定,且随着客户端数量的增加,本文方法相对于其它两种方法的优势越来越大,这体现了其高扩展性。
图8不同方法准确率与客户端数量的关系对比
Fig.8Comparison of the relationship between accuracy of different methods and the number of clients
4 结论
本文提出了一种基于联邦半监督学习的皮肤病变智能识别机制。其中,基于联邦学习的云边协同皮肤病变智能识别模型可以在保护用户隐私的同时利用各方数据联合训练,解决了单一医疗机构训练样本不足的问题;基于联邦半监督学习的皮肤病变智能识别机制,利用半监督学习解决了本地客户端有标签样本不足的问题;针对数据异构问题设计的半监督损失函数,通过有效控制本地模型与全局模型之间的差异,可以有效提升模型性能。此外,本机制引入的全局共识模型和准确率加权方法,可以明确各个本地模型的贡献,进一步提升全局模型性能。最后,在 ISIC 2018 分类数据集上的实验结果表明,本文所提机制与近期提出的FedAvg和FedProx相比,取得了更好的分类性能与可扩展性。
① https://challenge.isic-archive.com/landing/2018/此处的批注在正文中的什么位置,请标注清楚,或者直接放在正文中用括号插入。