架构师案例历年真题|第 7 期:2025 年 5 月

四季读书网 2026-05-18 17:29:32 1 0

案例分析第1题

某科技公司开发了一个面向开发者的在线大模型训练平台系统，该平台主要面向具备一定编程基础的用户，支持基于Python的模型编写、训练和部署流程。系统旨在简化模型开发流程，用户无需了解底层计算硬件配置，平台将自动解析代码并智能匹配训练资源进行运行。该系统设计初期就充分考虑了系统质量属性对平台稳定性、易用性和用户体验的影响，具体需求如下:

1.用户提交模型训练任务时，系统应在1分钟内分配资源并开始任务运行;

2.数据库发生故障时，能够在20分钟内切换至备用数据库，保证平台继续运行;

3.服务器发生故障时，能够自动切换至备用服务器，保障系统业务连续;

4.系统出现故障时，平台能够继续正常运行并通知管理员，同时应提供相关的操作日志、系统日志、访问日志和调试日志等信息;

5.用户界面需自动适配不同设备的分辨率和屏幕比例;

6.提供常用快捷键操作，提升平台易用性;

7.系统支持切换界面语言，方便不同语言背景用户使用;

8.支持远程用户进行测试和操作，但需限定为注册用户;

9.系统应支持来自不同终端设备(如浏览器、命令行工具、移动设备等)和操作系统(如Windows、Linux、macOS)的注册用户同时远程访问与操作平台，系统需能正确解析并响应各类客户端的指令，保证功能一致性与协同操作能力;

10.当系统功能需要调整时，应在3天内完成功能修改和部署上线;

11.系统需具备良好的故障恢复能力，在发生系统级故障时，15分钟内需完成修复;

12.系统需具备良好的异常容错机制，部分模块出错不应影响平台整体运行。

【问题1】(12分)根据上述系统描述，依次写出每条需求对应的系统质量属性。

【问题2】(13分)根据题干描述，将下图空白处补充完整，并说明该平台为什么适合用解释器风格

【问题1解答】（1）性能（2）可用性（3）可用性（4）可用性（5）易用性（6）易用性（7）易用性（8）可测试性（9）互操作性（10）可修改性（11）可用性（12）可用性

【问题2解答】（1）程序执行的当前状态（2）解释器引擎（3）解释器引擎的内部状态
该平台适合采用解释器风格架构，是因为其核心功能是对用户提交的 Python 模型代码进行解析和执行，而不需要用户关注底层硬件实现。
解释器风格能够将代码解析为抽象语法树，并逐条解释执行，天然适用于这种“代码即任务”的场景。它不仅支持灵活地扩展新语法和命令，还便于在执行过程中嵌入日志记录、调试信息和资源调度逻辑，增强系统的可控性与可维护性。因此，解释器风格非常契合该平台对动态性、灵活性和任务控制能力的需求。

案例分析第2题

某研究团队基于医疗领域的大量文本与结构化数据，构建了一个面向医疗知识图谱的问答系统。该系统面向医学科研人员与临床医生，支持实体识别、关系抽取、知识检索与答案生成等功能。由于系统设计较为复杂，包含数据预处理、自然语言处理、知识图谱构建、后端服务、前端服务、机器学习与深度学习等多个模块，系统采用“自底向上”的方式构建总体系结构。该系统主要包括:爬取医疗相关数据并建立知识图谱、提供实体识别和关系抽取服务、实现多种类型问答接口(如实体知识问答、药物关系问答、医学关系查询等)，并通过后端模块进行统一处理，生成答案。

【问题1】(9分)根根据题干描述的内容，将下列选项填入图中合适位置

(a)网络层、(b)数据层、©业务层、(d)知识层、(e)网页数据、(f)结构化数据、(g)数据采集、(h)知识获取、(i)知识清洗、(j)数据清洗、(k)知识管理、(l)实体获取、(m)关系获取、(n)意图识别、(o)语句解析、§知识检索。

【问题2】(7分)在构建医药知识图谱系统中，选择哪类数据库更适合存储知识图谱数据？请明确说明数据库类型及推荐技术实现，并结合医药数据特性说明理由。

【问题3】(9分)下图是 Scrapy 框架的核心结构图，其中挖空了三个关键组件，请根据图示结构，在图中标记的位置填入相应的模块名称，并请简要解释什么是“异步IO”。

【问题1解答】(1)c;(2)b;(3)f;(4)g;(5)j;(6)h;(7)k;(8)l;(9)p;(10)n

【问题2解答】推荐采用图数据库（如 Neo4j、Nebula Graph）进行存储。

（1）天然契合知识图谱的图结构：知识图谱本质上是包含实体（节点）和关系（边）的图模型。图数据库专门为存储和查询图结构数据而设计，能直接、直观地表示这种关联关系，无需像关系型数据库那样进行多表连接。

（2）高效的关系查询能力：医药问答涉及大量的关系查询（如“某药物的副作用有哪些？”“某疾病与哪些基因有关？”）。图数据库基于图遍历的查询方式在处理多跳、深层次关系查询时，性能远优于传统关系数据库的多表 JOIN 操作。

（3）良好的可扩展性：图数据库通常易于水平扩展，能够应对医药领域海量、持续增长的数据量。

（4）灵活性：图数据库的 schema 相对灵活，易于适应医药领域知识的不断演进和变化。

【问题3解答】Scrapy 框架空白处补充：
(1) Scrapy 引擎 (Scrapy Engine)：框架的核心，控制数据流，协调所有组件。
(2) 实体管道 (Item Pipeline)：负责处理 Spider 提取的数据（即 Item），进行持久化、清洗、验证等操作。
(3) 调度器 (Scheduler)：接收 Engine 的请求，并将其入队，等待下载。

异步 I/O 简要说明：
异步 I/O 是一种非阻塞的输入输出处理方式。程序发起 I/O 操作（如网络请求）后，无需等待其完成，可立即继续执行其他任务。当 I/O 操作完成后，系统通过回调、事件或通知机制告知程序获取结果。这种方式能充分利用 CPU 资源，避免线程空等阻塞，显著提升高并发场景下的吞吐量和响应速度。

案例分析第3题

某互联网企业开发并部署了一套高并发电商系统，系统中的商品信息、用户购物车、热销榜单等高频数据均存储在 Redis 中以提高访问效率。随着业务规模扩大，单实例 Redis 出现了性能瓶颈和单点故障风险。为提升系统的可用性、扩展性和数据容灾能力，技术团队决定采用 Redis 的主从复制架构，将写操作集中在主节点（Master），将读操作分散到多个从节点（Slave）中。同时，系统还需支持主从自动同步机制，确保在主库故障后可以快速切换至从库，保障业务连续性。

【问题1】(10分)请根据 Redis 的主从架构原理和下图的同步流程，在图示中填入正确的关键步骤和指令。

【问题2】(6分)主从库第一次同步完成之后，后面是如何同步的，请在图示中填入正确的关键步骤和指令。

【问题3】(9分)Redis 的数据持久化机制在生产环境中至关重要，当系统遭遇故障时需依赖持久化数据进行快速恢复。请详细阐述 Redis 的两种主要持久化方式，并对比分析其优缺点。

【问题1解答】（1）从库向主库发送 PSYNC ? -1 或 SYNC 请求，表示首次同步请求
（2）BGSAVE 命令，主库收到请求后执行 BGSAVE，生成 RDB 快照
（3）主库将写操作追加到 backlog，用于稍后的增量复制
（4）主库将 RDB 文件通过 socket 传输给从库（传输全量快照）
（5）主库将 backlog 中积压的写命令（增量）发送给从库

【问题2解答】（1）主库将写命令写入 AOF 日志和复制积压缓冲区（replication backlog buffer）
（2）主库将写命令通过 replication buffer（复制缓冲区）发送给从库
（3）从库执行主库发来的命令，应用到本地数据

【问题3解答】Redis 主要有两种数据持久化方式：RDB（快照持久化）和 AOF（追加日志）。
RDB 是通过定期生成内存快照的方式将数据保存为二进制文件，优点是文件体积小、恢复速度快，适合用于灾备和冷启动场景，但它是定时保存，可能在故障时丢失最近修改的数据。
AOF 则是将每一次写命令以日志形式追加记录到磁盘，优点是数据丢失更少、可读性高，但缺点是文件更大、恢复速度相对慢，且长期运行后需要重写以控制体积。

案例分析第4题

随着人工智能技术的发展，AI计算能力的部署方式呈现多样化趋势，主要包括云侧AI与端侧AI两种模式。两种部署模式各具优势，适用于不同的应用场景。

【问题1】(6分)请简要说明这两种AI的基本定义，并结合实际应用场景，说明端侧AI相较于云端AI的三项优势。

【问题2】(7分）资源池的核心架构设计需要考虑以下三个方面：（a）资源抽象与异构计算（b）动态调度与能效优化（c）安全机制与隔离

下表列出了一些资源池设计方法，请将相应的类别填入下标空格处。

【问题3】(12分)请根据下列指标对比三种资源池架构，前3空填写“高”“中”或“低”，后3空填写相应资源池的典型适用场景。架构师案例历年真题|第 7 期:2025 年 5 月第7张李工在当前项目中基于系统资源实时调度需求高，且系统规模相对固定，决定采用集中式资源池架构。但王工指出该方案存在以下三个潜在缺陷。请结合集中式资源池架构特点，指出这三项可能的缺陷。

【问题1解答】云端AI是指将AI模型部署在云服务器上进行训练与推理，适合处理高复杂度、需要大数据支撑的任务；而端侧AI则是在本地设备上运行模型，更注重实时性、隐私性和对网络的独立性。相比之下，端侧AI具有三大优势：一是响应速度快，适用于自动驾驶等需毫秒级决策的场景；二是数据无需上传，能保护用户隐私，如本地人脸识别；三是在离线或弱网环境下仍能正常运行，适合智能农机等应用。

【问题2解答】（1）b （2）c （3）a （4）c （5）b （6）b （7）a

【问题3解答】（1）低（2）高（3）低（4）中（5）高（6）中
（7）集中式资源池适用于系统规模中等、部署集中、资源调度实时性要求高、运维集中化、安全性要求高的场景
（8）分布式资源池适用于多业务、多地域部署或边缘计算等资源分散场景
（9）混合式资源池则适用于需同时支持云端与本地、具备弹性扩展需求的复杂业务系统。
集中式资源池的缺陷主要包括：扩展能力弱，难以灵活应对业务增长；存在单点故障风险，影响系统稳定性；不适用于用户分布广泛的场景，难以满足边缘计算对低延迟的需求。

案例分析第5题

随着信息技术的发展，农产品溯源系统在保障食品安全、提升消费者信任方面发挥着越来越重要的作用。传统的农产品溯源系统在数据篡改防范、信任机制建立等方面存在一定的局限性。近年来，区块链技术因其去中心化、不可篡改、可追溯等特性，被广泛应用于农产品溯源领域。
某市农业信息化管理部门计划建设一个基于区块链的农产品全流程溯源平台，实现从农田到餐桌全过程的数据上链，提升农产品质量追溯的透明度和可信度。为此，项目团队需对区块链的技术架构和各个层次进行深入理解和设计。

【问题1】(12分)请简要说明区块链技术的六个层次，并简要描述每一层的功能和作用。

【问题2】(9分)该系统中涉及三类角色：信息填写人员、核对人员、审核人员。请简要说明三类人员在业务流程中的主要操作步骤与职责差异，字数控制在400字以内。

【问题1】(4分)介绍下什么是智能合约，并说明智能合约包含哪三方面。

【问题1解答】

区块链技术体系可分为以下六个层次，每一层分别承担特定的功能：

数据层
功能：负责区块链中数据的结构定义与存储，如区块结构、链式结构、时间戳、哈希函数、非对称加密和梅克尔树等。作用：确保数据的完整性、不可篡改性和可验证性。
网络层
功能：负责节点间的数据传播与通信，采用P2P网络协议。作用：构建一个去中心化、点对点的传输网络，支持节点发现、数据广播与同步等。
共识层
功能：定义各个节点之间如何就数据达成一致的机制，如PoW（工作量证明）、PoS（权益证明）、PBFT（拜占庭容错）等。作用：保障全网数据一致性，防止双重支付和分叉问题。
激励层
功能：设定经济激励机制，用于奖励参与维护区块链网络运行的节点。作用：吸引节点参与系统运行，并对不良行为起到制约作用。
合约层
功能：支持智能合约的定义与执行，允许用户设定自动执行的逻辑规则。作用：实现业务逻辑自动化执行，提高效率，减少人为干预。
应用层
功能：为用户提供各类应用接口和可视化工具，实现具体的业务功能。作用：承载具体的区块链应用，如农产品溯源、数字资产管理、身份认证等。

【问题2解答】在区块链溯源系统中，信息填写人员负责第一步的数据录入工作，主要采集并填写农产品在生产、加工、运输等环节的基础信息，确保数据完整、及时上传。核对人员在其后对录入的信息进行内容核实，包括检查数据是否准确、是否存在遗漏或格式错误，是系统的数据质量保障环节。审核人员作为最终把关者，负责对核对通过的数据进行审批确认，一旦审核通过，信息将被正式写入区块链，不可篡改，确保数据的权威性与可追溯性。三类人员层层把关，构建了一个完整的数据采集与验证闭环。

【问题3解答】智能合约是一种运行在区块链上的自动化程序，用于在满足预设条件时自动执行合同条款。它不依赖第三方，具有去中心化、不可篡改和自动执行的特点，广泛应用于数字资产转账、供应链管理等场景。

智能合约主要包含以下三方面内容：1. 参与方身份信息：包括合同各方的地址、公钥等。2. 合约执行规则：明确合同执行的条件、逻辑和触发机制。3. 状态与结果记录：记录合同执行状态、数据变更及最终结果，确保全网可验证与追溯。

本文地址： https://sjds.net/703058.html

文章来源：四季读书网