摘 要:强化学习能够在动态复杂环境中实现自主学习,这使其在法律、医学、金融等领域有着广泛应用。但强化学习仍面临着全局状态空间不可观测、对奖励函数强依赖和因果关系不确定等诸多问题,导致其可解释性弱,严重影响其在相关领域的推广,会遭遇诸如难以判断决策是否违反社会法律道德的要求,是否准确及值得信任等的限制。为了进一步了解强化学习可解释性研究现状,从可解释模型、可解释策略、环境交互、可视化等方面展开讨论。
摘 要:语义分割在医学图像分析、战场态势感知等领域起着重要作用,但单一客户端通常无法为模型提供足够数量与多样性的训练数据,因此从复杂多变的分布式数据中训练语义分割模型是有必要的。为了不泄露数据隐私和保护数据安全,应用联邦学习在多客户端协同训练语义分割模型成为领域研究热点。在联邦语义分割定义基础上,围绕分布式复杂数据样本的数据异质性、标签缺失两个关键特征,开展联邦语义分割的问题描述、技术路径、典型模
摘 要:当前在交通信号控制系统中引入智能化检测和控制已是大势所趋,特别是强化学习和深度强化学习方法在可扩展性、稳定性和可推广性等方面展现出巨大的技术优势,已成为该领域的研究热点。针对基于强化学习的交通信号控制任务进行了研究,在广泛调研交通信号控制方法研究成果的基础上,系统地梳理了强化学习和深度强化学习在智慧交通信号控制领域的分类及应用;并归纳了使用多智能体合作的方法解决大规模交通信号控制问题的可行
摘 要:针对实用拜占庭容错共识算法(practical Byzantine fault tolerant,PBFT)通信开销大和缺乏奖惩机制的问题,提出一种基于信誉机制的改进PBFT共识算法RPBFT(reputed practical Byzantine fault tolerance)。首先,引入信誉机制对节点评分,将参与共识的节点分为收集器节点和普通共识节点,并对恶意节点进行惩罚。其次,收集
摘 要:优化区块链环境中现有预言机方案中的节点选择问题,以提高预言机节点选择的准确性和可靠性。引入了基于深度强化学习的区块链预言机节点选择中间件ORLM(oracle reinforcement learning model)。该中间件考虑了不同服务需求下多个节点的消耗,并建立了预言机节点的声誉值模型来评估预言机数据提供节点的声誉值,从而尽可能避免对具有恶意历史的节点的选择。通过深度强化学习DQN
摘 要:针对麻雀搜索算法收敛精度低、易陷入局部最优等问题,提出了一种融合相对距离和历史成功率的增强麻雀搜索算法(RHSSA)。首先,RHSSA引入一种融合适应度值与相对距离的发现者选择方式,使选出的发现者既保持较高质量,又保持在搜索空间的分布广泛;其次,RHSSA在麻雀发现者搜索过程中,采用融合加权重心的反向学习策略,充分挖掘搜索空间的优质位置信息并减弱发现者向原点聚集的趋势;最后,RHSSA引入
摘 要:针对工业机器人能耗轨迹优化问题,提出了一种基于金字塔层拓扑结构的粒子群算法。该算法引入了金字塔层式的拓扑结构,将粒子进行排序、分层,从而改进算法的竞争策略,增加了种群多样性;引入了新的合作策略以更新粒子的速度和位置;引入胜利百分比来自适应地调整粒子群算法的权重系数,提高了粒子的搜索效率。为了验证该算法的有效性,在测试函数集上进行了测试,并与其他八种变体粒子群算法进行比较,结果表明所提出的算
摘 要:针对平衡优化器算法存在的收敛精度低和易陷入局部停滞的问题,提出一种基于自适应交叉与协方差学习的改进平衡优化器算法。首先,构建外部存档来保留历史优势个体,增加种群多样性,以提高算法的全局寻优能力。其次,引入自适应交叉概率来平衡算法的全局探索能力和局部开发能力,以提高算法的寻优精度和鲁棒性。最后,采用协方差学习策略,充分利用浓度向量之间的关系来增强种群间信息交流,以避免算法陷入局部停滞。通过对
摘 要:现有的大多数进化算法在求解大规模优化问题时性能会随决策变量维数的增长而下降。通常,多目标优化的Pareto有效解集是自变量空间的一个低维流形,该流形的维度远小于自变量空间的维度。鉴于此,提出一种基于自变量简约的多目标进化算法求解大规模稀疏多目标优化问题。该算法通过引入局部保持投影降维,保留原始自变量空间中的局部近邻关系,并设计一个归档集,将寻找到的非劣解存入其中进行训练,以提高投影的准确性
摘 要:针对柔性作业车间批量流调度问题,基于快速换模技术,考虑可变子批划分柔性、子批混排加工柔性、自动换模柔性和物料运输柔性,建立以最小化完工时间和加工子批总数为目标的混排调度优化模型,并提出一种改进双档案多目标进化算法以优化目标函数。基于进化算法框架,设计了基于超体积指标和基于改进帕累托支配的双档案筛选机制,以平衡种群的收敛性和多样性;针对批量流混排调度问题特征,在解码阶段提出正/逆解码和子批拆
摘 要:为了解决多模态命名实体识别方法中存在的图文语义缺失、多模态表征语义不明确等问题,提出了一种图文语义增强的多模态命名实体识别方法。其中,利用多种预训练模型分别提取文本特征、字符特征、区域视觉特征、图像关键字和视觉标签,以全面描述图文数据的语义信息;采用Transformer和跨模态注意力机制,挖掘图文特征间的互补语义关系,以引导特征融合,从而生成语义补全的文本表征和语义增强的多模态表征;整合
摘 要:针对知识图谱中存在部分属性信息对实体对齐任务影响程度不一致以及实体的邻域信息重要程度不一致的问题,提出了一种结合双层图注意力网络的邻域信息聚合实体对齐(two-layer graph attention network entity alignment,TGAEA)方法。该方法采用双层图神经网络,首先利用第一层网络对实体属性进行注意力系数计算,降低无用属性对实体对齐的影响;随后,结合第二层
摘 要:知识蒸馏算法对深度神经网络的精简具有很大的推动作用。当前基于特征的知识蒸馏算法或只关注单个部分进行改进,忽视了其他有益部分,或是对小模型应重点关注的部分提供有效指导,这使得蒸馏的效果有所欠缺。为了充分利用大模型的有益信息并处理,以提升小模型知识转换率,提出一种新型蒸馏算法。该算法首先使用条件概率分布对大模型中间层进行特征空间分布拟合,提取拟合后趋于相似的空间注意力图,将其与其他有益信息一起
摘 要:动态三维迷宫是较为困难的、具有不确定性和不完全信息的强化学习任务环境,使用常规奖励函数在此环境中训练任务,速度缓慢甚至可能无法完成。为解决利用强化学习在动态迷宫中寻找多目标的问题,提出一种基于事件触发的综合奖励方案。该方案将三维迷宫中各种行为状态表达为各种事件,再由事件驱动奖励。奖励分为环境奖励和内部奖励,其中环境奖励与三维迷宫任务直接相关,含有体现任务目标的节点奖励和任务约束的约束奖励。
摘 要:针对订单实时更新的实际情况,为仍有待完成订单的司机持续分配任务,在保证司机收益增加的同时,提升拼车平台的派单效率。在考虑拼车系统服务质量与运行成本的基础上,基于平台角度构建了以司机总收益最大化为目标的双层规划模型,并给出求解该模型的双层算法:底层模型对拼车路径进行规划,设计改进的遗传算法求解;上层模型决定订单分配的顺序,通过贪心算法调用底层模型,比较收益变化后得到最终的调度结果。通过具体算
摘 要:为了提高车联网中车辆定位的精度,提出了基于车载雷达测距信息与全球卫星导航系统(global navigation satellite system,GNSS)信息融合的车联网协同定位方法。该方法使用极大似然估计策略建立数学模型,其本质是一个非线性优化问题。将其化简为具有多个二次等式约束的二次规划问题,并给出一种半正定松弛方法,可以高效地近似求解原问题,最后通过特征值分解法进一步改进该近似解
摘 要:针对驱动通路识别的相关研究依赖传统生物实验方法,存在费时费力且经济成本高的问题,提出一种新的二进制癌症驱动通路识别方法PEA-BLMWS。首先,利用已有的基因表达数据,通过对比正常基因与突变基因表达量的差异,挖掘潜在的基因突变数据;其次,引入蛋白质相互作用网络数据,构建出一个改进的二进制线性最大权重子矩阵模型;最后,提出一种双亲协同进化算法求解该矩阵模型。在GBM(glioblastoma
摘 要:针对zk-SNARK(zero-knowledge succinct non-interactive argument of knowledge)中计算最为耗时的多标量乘法(multi-scalar multiplication,MSM),提出了一种基于GPU的MSM并行计算方案。首先,对MSM进行细粒度任务分解,提升算法本身的计算并行性,以充分利用GPU的大规模并行计算能力。采用共享内存
摘 要:随着机器学习模型的广泛应用,研究者们逐渐认识到这类方法的局限之处。这些模型大多数为黑盒模型,导致其可解释性较差。为了解决这一问题,以集成学习模型为基础,提出了一种基于规则的可解释模型以及规则约简方法,包括生成优化的随机森林模型、冗余规则的发现和约简等步骤。首先,提出了一种随机森林模型的评价方法,并基于强化学习的思想对随机森林模型的关键参数进行了优化,得到了更具可解释性的随机森林模型。其次,
摘 要:在训练集存在噪声标签或类别不平衡分布的情况下,深度神经网络具有过度拟合这种有偏差的训练数据的不良趋势。通过设计适当的样本权重,使用重加权策略是解决此问题的常用方法,但不适当的重加权方案会给网络学习引入额外的开销和偏差,仅使用重加权方法很难解决有偏差分布下网络的过拟合问题。为此,建议将标签平滑正则化和类裕度正则化与重加权结合使用,并提出了一种基于自适应重加权和正则化的元学习方法(ensemb
摘 要:测试时间适应(test-time adaptation,TTA)的目标是利用未标记的测试数据使已训练完成的神经网络模型在测试时适应测试数据分布。现有的TTA方法主要考虑在单个或多个静态环境中进行适应。然而,在非平稳环境中,测试数据分布会随着时间的推移而连续变化,这导致以往的TTA方法不稳定。因此,提出了一种基于鲁棒和可靠对称交叉熵的测试时适应(robust and reliable sym
摘 要:预测性过程监控依赖于预测效果,针对如何增强预测性过程监控预测效果的问题,提出了一种基于行为轮廓矩阵增强的业务流程结果预测方法。首先,通过分析活动间的行为关系提取行为轮廓矩阵,并将其与事件序列一同输入到模型中。随后,结合卷积神经网络(CNN)和长短期记忆网络(LSTM)分别学习矩阵图像特征和序列特征。最后,引入注意力机制以整合图像特征和序列特征进行预测。通过真实事件日志进行验证,在预测事件日
摘 要:针对困难样本挖掘的图聚类算法是最近的研究热点,目前算法存在的主要问题有:对比方法和样本对加权策略缺少良好的融合机制;采样正样本时忽略了视图内部的“假阴性”样本;忽视图级信息对聚类的帮助。针对上述问题,提出困难样本采样联合对比增强的图聚类算法。首先使用自编码器学习嵌入,根据计算的伪标签、相似度、置信度信息为表示学习设计一种自加权对比损失,统一不同视图下节点对比和困难样本对加权策略。通过调整不
摘 要:情感对话系统的成功取决于语言理解、情感感知和表达能力,同时面部表情和个性等也能提供帮助。然而,尽管这些信息对于多轮情感对话至关重要,但是现有系统既未能够充分利用多模态信息的优势,又忽略了上下文相关性的重要性。为了解决这个问题,提出了一种基于双层解码的多轮情感对话生成模型(MEDG-DD)。该模型利用异构的图神经网络编码器将历史对话、面部表情、情感流和说话者信息进行融合,以获得更加全面的对话
摘 要:针对当前软件剩余使用寿命预测方法忽略了多性能指标间所蕴涵寿命信息的问题,提出一种融合多性能指标Transformer(TransMP)模型的Web系统剩余寿命预测方法。首先,搭建内存故障型Web系统加速老化实验平台,创建包含内存使用量、响应时间和吞吐率性能指标的数据集;其次,考虑不同性能指标蕴涵老化特征信息的差异性,构造由多编码器-解码器组成的TransMP模型,将性能指标数据分别输入内存
摘 要:预测性业务流程监控(PBPM)是业务流程管理(BPM)中的一个重要研究领域,旨在准确预测未来的行为事件。目前,PBPM研究中广泛引用了深度学习方法,但大多数方法只考虑单一的事件-控制流视角,无法将属性-数据流视角与之结合进行流程预测。针对这一问题,提出了一种基于双层BERT神经网络和融合流程多视角行为分析方法(简称FMP框架)。首先,基于第一层BERT学习属性-数据流信息;接着,基于第二层
摘 要:电子政务云中心的任务调度一直是个复杂的问题。大多数现有的任务调度方法依赖于专家知识,通用性不强,无法处理动态的云环境,通常会导致云中心的资源利用率降低和服务质量下降,任务的完工时间变长。为此,提出了一种基于演员评论家(actor-critic,A2C)算法的深度强化学习调度方法。首先,actor网络参数化策略根据当前系统状态选择调度动作,同时critic网络对当前系统状态给出评分;然后,使
摘 要:内窥镜去雾算法在医疗领域具有广泛应用,为临床医生提供清晰、实时的图像。去雾技术虽然已经取得较大的进步,但去雾算法的复杂度较高,在内窥镜等复杂情况下硬件实现较为困难。为了在硬件上实现内窥镜实时去雾效果,对暗通道先验算法进行改进,降低硬件资源消耗和时间复杂度。该改进算法选择适合硬件的大气光照强度估计值、透射率补偿值以及采用流水线结构实现有雾图像的处理。采用Xilinx的ZYNQ7020实现该算
摘 要:多源供能是提高清洁能源占比,助力制造企业绿色低碳转型的有效方式。然而受季节、天气等因素影响,可再生能源出力存在波动性,影响能源系统供应的稳定性。针对该问题,构建了企业生产运作与能源计划耦合优化的不确定整数规划模型,利用区间数描述能源出力的不确定信息。同时通过设计多种群融合策略、外部档案更新策略,提出了多目标混合鲸鱼群算法,有效地利用各个算法的寻优特性,提升整体性能,获得更优的Pareto解
摘 要:为了解决下行非正交多址系统中多用户通信的公平性问题,提出了基于公平性改善的双层挤压迭代功率分配方法。研究内容包括:首先,设计基于用户信道增益差的用户信道分裂过程,方便动态调整功率挤压时的挤压程度;其次,从强用户到弱用户进行内层功率挤压迭代,根据信道分裂情况设置挤压因子与附加挤压因子,使信道分裂处的弱用户对强用户挤压程度更强;第三,对内层挤压功率进行外层迭代的再分配与再挤压,可保持总功率不变
摘 要:针对多域网络中的切片存在域间时延不均的问题,提出了一种基于域间时延博弈的端到端动态协同切片方法(inter-domain dynamic game algorithm,IDGA)。采用博弈论方法将端到端时延约束分配到不同的网络域,通过在域内部署切片来获得相应的博弈收益,采用DDPG算法不断更新博弈策略,最终得到最佳的时延分配比例和切片部署方案。实验表明,该算法与传统的静态分配算法对比有明显
摘 要:为了应对第五代无线通信网络中数据吞吐量急剧增加的问题,移动边缘缓存成为了一种有效的解决方案。它通过在边缘设备上存储网络内容,减轻回程链路和核心网络的负担,缩短服务时延。到目前为止,大多数边缘缓存研究主要优化协作内容缓存,忽略了内容传输的效率。研究超密集网络的内容协作边缘缓存与无线带宽资源的分配问题,通过余弦相似度和高斯相似度求解基站之间总的相似度,将网络中的小基站根据总相似度进行分组,把缓
摘 要:针对实际认知超密集网络场景中认知无线电存在非完美频谱感知的情况,提出了一种基于非完美频谱感知的资源分配方案,目标是在考虑跨/同层干扰约束、保障用户服务质量下,最大化非完美频谱感知下认知超密集网络中次级网络的能效。为此,依据网络模型构建能效优化问题,其为混合整数非凸规划问题,先通过分时共享松弛法和丁克尔巴赫法将其转换成等价的凸优化问题,再使用拉格朗日对偶法求其最优解,以此获得最优能效时的子信
摘 要:针对面向隐式表达的神经辐射场的3D模型的版权问题,将神经辐射场水印的嵌入与提取视为一对图像变换的逆问题,提出了一种利用可逆神经网络水印保护神经辐射场版权方案。利用二维图像的水印技术以实现对三维场景的保护,通过可逆网络中的正向过程在神经辐射场的训练图像中嵌入水印,利用逆向过程从神经辐射场渲染出的图像提取水印,实现对神经辐射场以及三维场景的版权保护。但神经辐射场在渲染过程中会造成水印信息丢失,
摘 要:对抗训练(AT)是抵御对抗攻击的有力手段。然而,现有方法在训练效率和对抗鲁棒性之间往往难以平衡。部分方法提高训练效率但降低对抗鲁棒性,而其他方法则相反。为了找到最佳平衡点,提出了一种基于可学习攻击步长的联合对抗训练方法(FGSM-LASS)。该方法包括预测模型和目标模型,其中,预测模型为每个样本预测攻击步长,替代FGSM算法的固定大小攻击步长。接着,将目标模型参数和原始样本输入改进的FGS
摘 要:联邦学习是一种前沿的分布式机器学习算法,它在保障用户对数据控制权的同时实现了多方协同训练。然而,现有的联邦学习算法在处理Non-IID数据、梯度信息泄露和动态用户离线等方面存在诸多问题。为了解决这些问题,基于四元数、零共享与秘密共享等技术,提出了一种梯度隐藏的安全聚类与隐私保护联邦学习SCFL。首先,借助四元数旋转技术隐藏首轮模型梯度,并且在确保梯度特征分布不变的情况下实现安全的聚类分层,
摘 要:协同加解密是安全多方计算中的重要研究方向,它可以安全高效地实现数据保护、隐私保护。为解决现有SM4协同加解密方案离线计算阶段计算复杂度偏高的问题,提出一种基于不经意多项式估值的SM4协同加解密方案。方案利用预计算的多项式集合和多项式值集合来完成在线阶段的S盒协同计算,从而提高在线计算阶段的性能。其证明了所提方案的正确性和安全性,同时与四种不同的方案进行对比,结果表明,所提方案计算效率明显高
摘 要:针对现有人脸活体检测算法的特征表示不佳,以及在跨数据集上泛化性能较差等问题,提出了一种基于内容风格增强和特征嵌入优化的人脸活体检测方法。首先,使用ResNet-18编码器提取来自多个源域的通用特征,并经过不同注意力机制的两个自适应模块进行分离,增强全局内容特征与局部风格特征表征;其次,基于AdaIN算法将内容特征与风格特征进行有机融合,进一步提升特征表示,并将融合后的特征输入到特定的分类器
摘 要:为了解决现有脑提取网络结构复杂、参数量大且推理速度不高的问题,受UNeXt启发,提出一种基于3D卷积、3D多层感知机(multilayer perception,MLP)和多尺度特征融合的轻量级快速脑提取网络3D UNeXt,极大地减少了参数和浮点运算量,取得了令人满意的结果。3D UNeXt以U-Net为基本架构,在编码阶段使用3D卷积模块获取局部特征;在瓶颈阶段通过3D MLP模块获取
摘 要:在医学图像分割任务中,域偏移问题会影响训练好的分割模型在未见域的性能,因此,提高模型泛化性对于医学图像智能模型的实际应用至关重要。表示学习是目前解决域泛化问题的主流方法之一,大多使用图像级损失和一致性损失来监督图像生成,但是对医学图像微小形态特征的偏差不够敏感,会导致生成图像边缘不清晰,影响模型后续学习。为了提高模型的泛化性,提出一种半监督的基于特征级损失和可学习噪声的医学图像域泛化分割模
摘 要:针对现有变化检测方法局部特征和全局特征难以兼顾、变化对象和背景之间分界模糊的问题,提出了一种基于局部-全局特征耦合与边界引导的遥感图像建筑物变化检测方法。该方法在编码阶段采用并行的卷积神经网络和Transformer分别提取遥感图像的局部特征与全局表示。在不同尺度下,使用局部-全局特征耦合模块融合局部特征和全局特征表示,以增强图像特征的表达能力。引入边界引导分支获取变化对象的先验边界信息,
摘 要:当前流行的基于深度神经网络的图像修复方法,通常使用大感受野的特征提取器,在修复局部图案和纹理时,会产生伪影或扭曲的纹理,从而无法恢复图像的整体语义和视觉结构。为了解决这个问题,提出了一种基于优化感受野策略的图像修复方法(optimized receptive field,ORFNet),将粗糙修复与精细修复相结合。首先,使用具有大感受野的生成对抗网络获得初始的粗略修复结果;然后,使用具有小
摘 要:多聚焦图像融合(MFIF)是从不同源图像中获取聚焦区域,以形成全清晰图像的一种图像增强方法。针对目前MFIF方法主要存在的两个方面问题,即传统的空间域方法在其融合边界存在较强的散焦扩散效应(DSE)以及伪影等问题;深度学习方法缺乏还原光场相机生成的数据集,并且因需要大量手动调参而存在训练过程耗时过多等问题,提出了一种基于目标图像先验信息的无监督多聚焦图像融合方法。首先,将源图像本身的内部先
摘 要:低光照等恶劣环境下的目标检测一直都是难点,低光照和多雾因素往往会导致图像出现可视度低、噪声大等情况,严重干扰目标检测的检测精度。针对上述问题,提出了一个面向机器视觉感知的低光图像增强网络MVP-Net,并与YOLOv3目标检测网络整合,构建了端到端的增强检测框架MVP-YOLO。MVP-Net采用了逆映射网络技术,将常规RGB图像转换为伪RAW图像特征空间,并提出了伪ISP增强网络DOIS
摘 要:位姿图优化 (pose graph optimization,PGO)是一种在同时定位与地图构建(simultaneous localization and mapping,SLAM)后端优化中常用的高维非凸优化算法,通常建模成极大似然估计。由于目前的PGO算法优化大规模大噪声数据集时很难在保证精度的同时提升速度,所以提出了一种基于嵌套剖分的位姿图分层优化算法。该算法首先建立不同距离度量的