2019:05:19   今天是星期日   21:08:50
APP下载 万链之家APP

Android

超越比特币:人工智能中区块链的关键应用

04-24 14:30

标签    区块链    区块链技术   区块链应用   加密货币   区块链开发

文章来源: 万链之家

模型治理和可解释性对于构建道德和可审计的区块链和AI技术至关重要。


尽管比特币是区块链技术最着名的实例,但我们才刚刚开始发现该系统的真正潜力,它记录任何类型的交易并在对等网络中维护记录。


在2018年,我转向对区块链的思考,围绕使用区块链制作了一项专利申请(16 / 128,359 USA),以确保所有关于机器学习(ML)模型的决策都被记录下来并且是可审计的。


另请参阅:区块链即服务 - 寻找问题的解决方案?


这些包括模型的变量,模型设计,使用的训练和测试数据,特征的选择,查看模型的原始潜在特征的能力,以及向区块链记录构建变量集的不同部分的所有科学家,参与模型权重创建和模型测试。


通过区块链技术实现,这些决策的总和和总记录提供了在内部有效管理模型和满足监管机构所需的可见性。


模型治理和可解释性对于构建可审计的道德AI技术至关重要;作为数据科学家和全球分析社区的成员,创建道德分析技术对我来说非常重要,特别是在为金融和企业客户提供服务方面。


区块链之前:分析模型漂移


在区块链成为流行词之前,我开始在我的数据科学组织中实施类似的方法。 2010年,我制定了一个以分析跟踪文档(ATD)为中心的开发流程。这种方法详细的模型设计,变量集,科学家分配,训练和测试数据,以及成功标准,将整个开发过程分解为三个或更多敏捷冲刺。


我认识到需要一种带有ATD的结构化方法,因为我看到太多银行业已成为常态的负面结果:缺乏验证和问责制。十年前,分析模型的典型寿命如下所示:


数据科学家构建模型,自行选择它包含的变量。这导致科学家创建冗余变量,而不是使用经过验证的变量设计和在模型代码中创建新错误。在最糟糕的情况下,数据科学家可能会使用可能引入偏差,模型敏感性或目标泄漏的变量做出决策。


当同一数据科学家离开组织时,通常会删除他或她的目录。通常,有许多不同的目录,并且不清楚最终模型的目录是什么。该公司没有该模型的源代码,或者可能只有它的一部分。没有人明确地理解模型是如何构建的,构建模型的数据以及模型构建中的假设。


最终,银行可以通过假设模型正确构建并且表现良好而处于高风险状态,但不是真的知道。银行无法验证模型或了解在何种条件下使用它需要非常小心。这些现实导致不必要的风险或大量模型被丢弃和重建。经常重复上面的旅程。

用于编纂问责制的区块链


我的专利描述了如何使用区块链技术编纂分析和机器学习模型开发,以将一系列实体,工作任务和需求与模型相关联,包括测试和验证检查。它复制了我用于在我的组织中构建模型的方法 -  ATD基本上是我的科学家,经理和我之间的合同,描述:


模特是什么


该模型的目标


我们将如何构建该模型


模型必须改进的领域,例如,交易级别的卡不存在(CNP)欺诈改善30%


科学家必须解决问题的自由度,以及他们没有解决问题的自由度


重用可信和验证的变量和模型代码剪切它


培训和测试数据要求


特定模型测试和模型验证清单


特定的分析科学家建立变量,模型,培训他们以及那些将验证代码,确认结果,执行模型变量测试和模型输出的人


模型和特定客户群的具体成功标准


分配了特定的分析冲刺,任务和科学家,以及满足正式冲刺审查/批准的要求。


如您所见,分析跟踪文档通知了一组非常具体的需求。该团队包括我作为敏捷模型开发过程的所有者,另外还包括直接建模管理器和分配给项目的数据科学家组。团队中的每个人都将ATD签署为合同一旦我们全部协商了我们的角色,职责,时间表和构建要求。 ATD成为我们定义整个敏捷模型开发过程的文档。然后将其分解为一组要求,角色和任务,这些要求,角色和任务放在区块链上,以便正式分配,工作,验证和完成。


根据每个要求跟踪个人,团队然后评估一组现有的抵押品,这些抵押品通常是先前经过验证的变量代码和模型的一部分。一些变量在过去已被批准,其他变量将被调整,还有一些变量将是新的。然后,区块链记录每次在该模型中使用变量时 - 例如,从代码存储中采用的任何代码,编写的新代码以及所做的更改 - 谁执行了哪些代码,哪些测试已完成,以及批准的建模管理器它,我的签字。


粒度跟踪


重要的是,区块链实例化了一系列决策。它显示变量是否可接受,是否将偏差引入模型,以及变量是否正确使用。我们可以在非常精细的层面上看到:


模型的各个部分


模型的运作方式


它响应预期数据的方式,拒绝不良数据或响应模拟的变化环境。


所有这些项目都是在模型工作人员和批准每项行动的背景下编纂的。在项目结束时,我们可以看到,例如,这个关键模型中包含的变量,每个变量都已经过审查,被放在区块链上并获得批准。


这种方法提供了很高的置信度,没有人在模型中添加变量,表现不佳或在模型中引入某种形式的偏差。它确保没有人在他们的数据规范中使用了不正确的字段,或者在没有许可和验证的情如果没有ATD提供的严格审查流程以及现在的区块链使其可审计,我的数据科学组织可能会无意中引入一个有错误的模型,特别是当这些模型和相关算法变得越来越复杂时。


具有更多可解释性和更少偏见的模型


总而言之,在区块链上叠加模型开发过程为分析模型提供了自己的实体,生命,结构和描述。模型开发成为一个结构化的过程,最后可以生成详细的文档,以确保所有元素都经过了适当的审查。这些也可以在未来的任何时候重新审视,也可以用于模型治理。


利用区块链来协调ATD和敏捷模型开发过程可以由开发组织外部的各方使用,例如银行的治理团队及其监管单位。如果监管机构想要审计关键模型的构建方式,那么他们的审查可以产生一个声明,例如“所有变量都经过审查并得到......的批准”。同样,如果监管环境的修订或变更使我们想要从我们的大型资产变量库中了解变量#51817的生产中的所有用途,我们可以轻松查询区块链以确定生产模型中的任何用法。


通过这种方式,分析模型开发变得高度可解释并且可以审计决策,这是提供道德和可解释AI技术的关键因素。可解释性对于消除用于制定影响个人财务生活的决策的分析模型的偏见至关重要。


X
  • 打赏支付
当前账户总金币:0
请选择打赏金额:
  • 100
  • 300
  • 500
  • 1000
  • 1500
  • 2000
    收藏
声明:万链之家登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

暖男会发光

0打赏金币 6所得总金币

    最新发表    最高金币  最高点击量

特约作者

7x24h快讯更多 >>
  • 46分钟前

    BTC跌破7900 数字货币总市值失守2500亿美元大关... [快讯详情]

  • 59分钟前

    北京出现自助购买比特币机器... [快讯详情]

  • 19:48

    SBI宣布下线BCH后公布BCH提款手续... [快讯详情]

  • 19:01

    澳大利亚初创公司TrustED将在币安链上推出其区块链网络... [快讯详情]

  • 18:55

    Bibox系统升级时间延长,暂无确认完成时间... [快讯详情]