deepOnet网络研究

2025-04-12

Word count: 1.1k | Reading time≈ 4 min

DeepONet（Deep Operator Network）突破传统神经网络点到点映射的局限，专注于学习函数到函数的映射关系，在函数逼近、偏微分方程求解等科学与工程领域具有重要应用价值。

DeepONet 架构

DeepONet 核心由分支网络（Branch Network）和主干网络（Trunk Network）两个子网络构成，实现输入函数到输出函数的映射学习。

对于定义域为 $\Omega$ 的输入函数 $u(x)$ ，分支网络 $B$ 通过一系列神经网络层处理，将其编码为低维特征向量 $\mathbf{z}_u$ ，即 $\mathbf{z}_u = B(u(x))$ ，完成对输入函数的特征提取。

针对定义域为 $\Gamma$ 的输出函数 $v(y)$ ，主干网络 $T$ 接收输出函数采样点 $y$ 作为输入，经网络层处理后输出特征向量 $\mathbf{z}_y$ ，表达式为 $\mathbf{z}_y = T(y)$ ，聚焦于输出函数的空间位置特征提取。

输出层将分支网络与主干网络的输出 $\mathbf{z}_u$ 、 $\mathbf{z}_y$ 进行拼接，再通过全连接层 $F$ 得到最终输出值 $v(y)$ ，即 $v(y) = F([\mathbf{z}_u; \mathbf{z}_y])$ ，实现双特征融合输出。

DeepONet 原理

函数逼近理论

基于神经网络万能逼近定理，复杂神经网络可任意精度逼近连续函数。DeepONet 通过分支网络与主干网络协作，逼近输入函数到输出函数的映射关系 $v = \mathcal{G}(u)$ 。在训练中，通过大量输入 - 输出函数对 $(u_i, v_i)$ 学习，掌握近似映射 $\hat{\mathcal{G}}$ ，使 $\hat{\mathcal{G}}(u)$ 接近真实输出函数 $v$ 。

训练机制

DeepONet 采用监督学习训练，给定训练数据 $\{(u_i, v_i)\}_{i = 1}^N$ ，以最小化预测输出 $\hat{v}_i$ 与真实输出 $v_i$ 之间的损失函数 $L$ 为目标，即 $\min_{\theta} \sum_{i = 1}^N L(\hat{v}_i(\theta), v_i)$ ， $\theta$ 涵盖网络所有可训练参数。常用损失函数包括均方误差（MSE）、平均绝对误差（MAE）。训练时利用反向传播算法计算梯度，借助 Adam 等优化器更新参数，降低损失值。

DeepONet 在偏微分方程求解中的应用

偏微分方程概述

偏微分方程（PDEs）广泛应用于科学与工程领域，用于描述物理现象，一般形式为 $\mathcal{L}(u) = f$ ，其中 $\mathcal{L}$ 为微分算子， $u$ 为待求解函数， $f$ 为已知源项，同时需满足特定初始条件和边界条件，如流体力学的 Navier - Stokes 方程、热传导方程等。

求解方法

使用 DeepONet 求解偏微分方程时，将方程的解视为从输入函数（初始条件、边界条件等）到输出函数（方程的解）的映射。以热传导方程 $\frac{\partial u}{\partial t} - \alpha \nabla^2 u = 0$ 为例， $u(x, t)$ 为温度分布函数， $\alpha$ 为热扩散系数，将初始条件函数 $u_0(x)$ 和边界条件函数 $g(x_b, t)$ 作为网络输入，训练模型学习该映射关系。

DeepONet 在偏微分方程求解方面相比有限元法、有限差分法等传统数值方法优势显著。其可快速处理不同参数设置的方程，避免复杂的网格划分与数值计算，且能捕捉复杂物理现象和非线性关系。实验数据显示，在保证精度的前提下，DeepONet 求解速度可达传统方法的数倍乃至数十倍，适用于大规模科学计算与工程应用。

总结与展望

DeepONet 作为创新神经网络架构，为函数到函数映射学习提供有效方案，在偏微分方程求解等领域潜力巨大。但仍面临提升泛化能力、优化训练效率、融合物理先验知识等挑战。随着深度学习技术发展，DeepONet 有望取得更多突破，为科学和工程领域带来新的解决方案。

Donate