音视频实践日 Live|在线监考场景的应用实践

类别:
技术道场
发布时间:
8月26日

在线监考场景中,有哪些痛点和难点?七牛云在线监考方案是如何解决的?未来又有怎样的规划?在**「音视频实践日 Live」直播活动中,七牛云音视频解决方案技术专家宣利民,为我们就「在线监考场景的应用实践」话题带来分享。**

本文内容基于宣利民分享整理,为方便阅读略有删改。


大家下午好,我是来自七牛云的宣利民。今天我给大家带来的议题是在线监考场景的应用实践。

我的分享会从三个部分展开。首先为大家介绍在线监考的起源和背景,阐述在线监考场景的难点。第二部分会重点讲七牛云在线监考方案的实现与打磨。第三部分会给大家带来未来的规划。

在线监考场景的难点

从在线监考本身来看,它很难成为一个单独的场景。因为监考首先得有考试,所以考试和监考其实是两个结合非常紧密的场景。那么讲监考之前,我们可以先讲一下在线考试。

考试本身有非常悠久的历史,比如我国历史上的科举,流程和监考过程都非常严谨。在线考试的历史,也可以追溯到上世纪九十年代的美国,目前已经发展到全球一百多个国家。在线考试利用互联网技术和计算机快速运算的特点,可以快速、准确地进行考试。

之所以能日渐普及,源于在线考试具备的优势。第一个方面当然是成本节约,因为考生可以在任何地方,只要有一台电脑就可以进行对应的考试。也就是说,整个过程是动态的,所有的组织不需要集中在一个考场里,是高度自动化的。如果考试选择题或填空题居多,整个批改的过程也会非常的高效和便捷,可以极大降低阅卷的工作量。同时阅卷全部是由计算机来进行介入,可以让整个考试过程更加公正,这对整个考试而言意义重大。

作为完整的在线考试系统,面向的用户可见上图。从用户层开始,通过 PC 或移动设备进行访问,接下来会有一些前端的处理,前端通过各种协议,例如 socket 或者 http 对应考试或试卷,然后调到业务层,业务层里有考试、题库、考场管理、考生管理的业务单元,在底层会有数据库和存储。

那为什么七牛云要做在线考试、在线监考?它整个的市场规模如何呢?

从几个方面来讲。首先是政策环境,自去年开始,国家对教育行业进行政策上的影响,所以目前职业教育会成为在线考试的新风口。第二个是经济层面,从宏观上来讲,因为在线监考可以有效降低成本,能够让整个社会运转成本下降。然后从文化环境来讲,疫情后的在线考试、在线办公都得到了极大的普及和爆发式增长,考生和组织方对线上考试的接受度也是有非常大的提高。最关键的一点,是整个技术环境有了质的发展,基于 5G 和 RTC 技术的成熟,使在线监考、在线考试的稳定性和监考的公平性,都得到非常大的提升。通过 AI 的引入,可以使整个监考过程中的舞弊行为被更好地甄别。

通过恒州智博研究中心的推演,在线考试的市场规模,从 2020 年的 31 亿将会增长到 2027 年的 86 亿,年均增长率达到 15.9%。所以从市场规模来讲,这其实会是一个比较有前景的行业。

对在线监考来说,我们可以先分析客户的诉求。我们把它归为三个要点:首先是跨区域跨时间,然后是成本上的节约,最后是监考的公平性。除此之外,也有一些批量上传试卷和智能分析的诉求。

那分析客户的诉求以后,我们发现在线考试会有一个痛点。就是公正性,其实对任何考试来说,公平公正才是最被关心的一点。

其实大家可以想一下,如果我在一台电脑上进行考试,会的题目就直接做掉了,如果不会,那这个时候怎么办?最简单的,可能拿着题目去网上搜索一下,然后可能立马就有答案,或者刚好我不会,我旁边请了个比较厉害的人,他跟我讲然后我来做。那这样的话,会严重影响整个考试的公平、公正,也会严重影响整个行业的发展。所以我们在线监考,其实是重点着眼于怎么确保整个考试的公平、公正。基于这样的情况,业务实现上的难点主要是远程人工监考下,漏检率要得到改善,要在监考过程中,对各种舞弊行为能够及时告警,后续也能进行及时复盘,包括数据、证据的一些落地。最后是在线监考会涉及到非常多的服务,我们帮客户快速把这些服务对接起来,更好地落地。

七牛云在线监考方案的实现

在这一部分的开始,大家可以先看下图,是我们七牛云的一些方案页面。

首先是设备的验证,要确保考生的麦克风和耳机是能够正常使用的。第二部分是需要确保考生能够进行身份验证,这里我们会带来七牛云身份认证的一些服务,会跟公安部身份证信息进行比对,确保人证统一,不会有替考行为出现。第三个重点放在考生答题过程中的一些动作。

比如作为考生来说,他需要做几件事情,一个是把摄像头打开,让监考者能够看到考生的行为。第二个是需要考生把自己的屏幕共享出来,整个屏幕上的操作在后端能够监看到。第三会让考生拿起他的手机,把手机架在自己的后方 45 度,确保考生周围是一片干净的场景,没有人员或者设备进行干扰,确保整个考试是比较安静的,没有其他人进行指点。

最后一图是作为监考者的视角,除了能看到每个考生的情况,我们也会把一些疑似舞弊的行为标注出来,便于监考者进行排查。监考者也可以跟考生进行语音通话,包括提醒大家注意行为,或者终止考试的进度。

那从这里可以看出,考生的两路视频流,一路是摄像头的,一路是手机的,再加上桌面的屏幕情况也可以被监看,所以可以很好地保障整个考场的公平、公正。

七牛云的在线监考方案,从核心模块上来讲会分为四个部分:

第一个是实时监测,这也是最核心的功能。我们会通过三路流同时上传的形式,确保整个线上考场的稳定。那三路流会通过 RTC 的方式进行上传,延迟低至 200 毫秒以内,确保任何舞弊的操作都能够得到及时反馈。我们也是支持浏览器跟手机的同步进行,远程支持多终端,iOS、安卓、PC 都是能够支持的。

第二个功能是我们在整个在线监考里引入了 AI 的能力,包括考试前的人脸识别和身份验证。考试中我们会有一些人员隔离框的检测,包括我们会监控考生切换屏幕、复制粘贴的一些操作,然后包括所有的语音识别,来确保整场考生里没有额外因素的干扰。

第三个我们做了监考管理的功能模块,这里面就会有监考大屏。我们在整个监考的大屏里有两种监考方式,一种是视频流监考,还有一种是图像监考。视频流监考就会把考试的三路流转化为一路流,在大屏上可以实时监考。图像监考可以把考生的三路流集中生成对应的图片,图片监考辅以 AI 检测,会把对应的疑似行为提前标注,便于监考官能够更好地发现异常场景。

那第四个部分,是所有考试视频我们会进行录制,便于后期梳理。这里我们所有的功能都是通过 High-level SDK 接入的。

那什么叫 High-level SDK?High-level SDK 是基于具体场景,来提供不同版本的一些接口。比如说人脸检测,那如果不用 High-level SDK,那可能就需要先进行 RTC 流的截帧,截完帧以后上传到对应的存储,拿到接口以后进行接口的返回,再在终端进行展示。那我们这里就会把对应的流程包装成接口,就叫人脸检测,这样接口上就可以实现核心的功能。那这一块其实所有的 High-level SDK 接口,都是跟场景相绑定,用户对接起来会非常简便。

下图是我们在线监考方案的整体架构。其中可以看到,我们将其分为端和云两部分进行展示。端上我们会有屏幕共享、实时的监考和答题,进行对应的能力输出。然后用户可以集成我们对应的 High-level SDK,来封装它对应的客户端或者 web 端。

云上会用到非常多的内置功能,比如 RTC 里就会有我们最核心的屏幕共享,会有房间的管理。对在线监考来说,我们会把一个考生作为一个房间,那他的三路流就会作为房间里的三个所有者,包括一路屏幕流,一路摄像头的流,以及手机流。其中我们还会用到直播的一些场景,因为我们需要把对应的整个考试过程录制下来。我们内部也会打通 RTC 和智能多媒体的一些服务,提供对应的检测、身份认证等相关功能。

那最后,我们所有的机器日志、对应的打点日志,都会存储到我们机器数据处理平台去。可以让用户在后期进行对应的检索以及可视化监控。目前来说,在线监考服务了众多客户,整体非常成熟。

从整个方案架构上来讲,可以拆分成两类,一类是考生,一类是监考人员。考生需要做的事情包括两个动作,一个是进行答题,第二个是把答题过程实时推到云端,供监考官查看。

在这个过程中,首先考生需要在 PC 界面打电脑摄像头的流,然后进行考试题目的选择。这样在 PC 界面就会把两路流推到我们的 RTC 上,一个是属于监考电脑摄像头的流,还有一个是考试屏幕的流。同时我们要求所有的考生拿出手机,扫描屏幕上的二维码,就会自动进入考生自己的房间。那需要把他的手机,放在其后方 45 度的视角。这样从考生的视角而言,他需要把三路对应的流,推到我们 RTC 的云上。

对监考人员来说,一场考试可能面对一百个人甚至一千个人,那他需要监考到所有考生的情况。这里我们会重点给他一些对应的提示和告警,监考人员可以有针对性地选定某一个考生。如此一来,考官可以实时查看每个考生的三路流,如果有疑似情况,那他就可以进行对应的处理。

流转到了 RTC 以后,我们会打进流内部的智能多媒体,在这里面就会做对应的 5G 检测和替换。比如说屏幕上显示一个人,后面突然来了另一个人,这种情况我们就会进行对应的报警。那也有可能人没出现,但是声音多了一个,这样也会报警。

还有就是考生会进行屏幕切换,比如打开浏览器进行检索的操作,或者是键盘的一些特定操作,我们也能够监控得到。

以上就是我们在线监考的介绍。

接下来会为大家介绍我们方案的优势,主要有四个方面。第一是通过我们七牛云 RTC 的低延时和 AI 能力的结合,提升整个作弊的检出率,确保整个考试的公平、公正。第二个是通过我们实时大盘和过程数据的标注,可以有目的、有选择地进行实时监考,让老师的效率得到大幅提升。第三是通过 High-level SDK 的接入,可以帮助我们的客户大幅缩减开发成本,让产品快速上线,服务更多的客户。第四是因为我们的存储可以进行多样化选择,用户可以使用七牛云的云存储,如果用户有自建存储,也可以把对应的视频,放到自建存储里来缩减成本。

在线监考方案未来的规划

接下来我为大家介绍整个在线监考方案的未来规划。其实刚才讲到,我们提供了 High-level SDK,它会让整个接入成本降低,用户不需要强大的开发能力也可以接入使用。

尽管如此,对很多客户来说,可能还是觉得会有一些门槛,所以基于这种现状,我们正在构建低代码平台。其中的核心概念,就是最大化降低客户的使用门槛。他如果想跑通标准的在线监考,如果没有太多个性化的配置,理论上不需要自己开发,直接使用我们的低代码平台就可以一键运行。它跟 High-level SDK 的区别是,完全不需要自己搭建后端和业务平台,我们的低代码平台还会提供所有的 UI 页面、后端逻辑和业务操作。

为了更好地服务客户,我们的低代码平台将公用的业务组件进行封装,包括房间、连麦 PK 等具体场景的标准组件,以及服务端的能力和对应的 UI 的页面。那在低代码平台上,会衍生出在线监考、互动直播、电商直播带货等各类产品。客户如果需要对应的场景,就可以一键把服务跑起来。

目前来看,用户使用我们的方案,一两天就可以完整实现产品的上线。如果他有一些个性化的诉求,整个更改起来也是非常的便捷。

在低代码方案中,我们帮用户做的事情会比之前更多。我们不仅会帮用户画 UI、实现交互,也会提供用户的业务服务端,包括互动直播、PK、禁言、举手等操作。用户可以在我们的低代码服务器申请低代码的 token,然后把我们的低代码嵌入到他的自己的业务应用里面,然后访问整个低代码的服务器,其中会有各种业务组件,理论上就不太需要开发代码。目前这一块低代码服务端我们是开源的,所以用户可以部署在自己的服务器上。

对用户而言,通过下图所示的三步操作,即可实现集成。

目前我们新一代的低代码产品,理论上只需要十行代码就可以。如果它需要修改,可以在里面进行一些功能或者组件的替换。整个替换都是开放的,也非常便捷。

所以,低代码会作为我们团队接下来非常重要的一个方向,刚才讲到的各类监考场景,也会往低代码方向上迁移。希望通过我们的不断努力,为用户提供更加优质便捷的服务。

今天我的分享就到这里,谢谢大家。

微信咨询
微信咨询
电话咨询
智能客服