Data-Driven 定位方法调研与对比
1. 方法分类总览
Data-Driven 定位方法
├── 纯数据驱动(端到端学习)
│ ├── 指纹法 (Fingerprinting)
│ ├── DNN / MLP 回归
│ ├── CNN(RSSI 图像化)
│ ├── RNN / LSTM / GRU(时序)
│ ├── Transformer
│ └── GNN(图结构)
├── 概率学习
│ ├── Gaussian Process Regression (GPR)
│ ├── Bayesian Neural Network
│ └── Variational Inference
└── 混合方法(模型 + 数据)
├── 可学习路径损耗模型
├── 可学习权重 w_i
├── Physics-Informed Neural Network (PINN)
└── 残差校正 (Residual Correction)
2. 纯数据驱动方法
2.1 指纹法 (Fingerprinting)
原理:离线阶段在网格点采集 RSSI 向量构建"无线电地图",在线阶段匹配。
| 变体 | 在线匹配方式 | 典型精度 |
|---|---|---|
| k-NN | 欧氏距离最近邻 | 2–3 m |
| WKNN | 加权 k-NN(距离反比权重) | 1.5–2.5 m |
| 概率指纹 | P(location | RSSI),核密度估计 | 1–2.5 m |
| ML 指纹 | SVM / Random Forest / DNN 训练 | 1–2 m |
优势:无需路径损耗建模,精度高。 劣势:
- 采集成本极高(每平方米需多次采样)
- 无线电地图随环境变化退化(AP 增减、家具移动)
- 众包场景不适用:好心人位置每次不同,无法预建固定指纹库
适用性评估:❌ 不适合本项目(众包 + 动态锚点)
2.2 DNN / MLP 直接回归
原理:输入 N 维 RSSI 向量,输出 (x, y) 坐标。
Input: [RSSI_1, RSSI_2, ..., RSSI_N] → MLP(hidden layers) → Output: (x, y)
代表工作:
- Félix et al. (2016): 3 层 MLP,BLE 指纹定位,中位误差 1.7 m
- Cha & Lim (2022): 深度残差网络,WiFi+BLE 融合,1.2 m
优势:能学到复杂非线性映射。 劣势:
- 需要大量标注数据(位置-RSSI 对)
- 泛化性差:换楼/换设备需重新训练
- 输入维度固定(信标数量变化时无法处理)
适用性评估:⚠️ 有限适用。众包场景中好心人数量不固定是关键障碍。
2.3 CNN(RSSI 图像化)
原理:将 RSSI 向量重组为 2D 图像(如按信标空间位置排列),利用 CNN 提取空间特征。
代表工作:
- Kim et al. (2018): RSSI heatmap + CNN,WiFi 定位,1.5 m
- Abbas et al. (2019): 时频域 RSSI 图 + CNN,BLE,1.8 m
优势:CNN 天然擅长空间模式识别。 劣势:RSSI 向量到 2D 图像的映射方式需精心设计;固定信标拓扑假设。
适用性评估:❌ 不适合(需要固定信标拓扑)
2.4 RNN / LSTM / GRU(时序方法)
原理:将 RSSI 时间序列作为输入,学习时序依赖关系进行轨迹估计。
Input: RSSI(t-k), ..., RSSI(t-1), RSSI(t) → LSTM → Output: (x, y)(t)
代表工作:
- Hoang et al. (2019): LSTM + attention,WiFi 轨迹估计,1.5 m
- Poulose & Han (2021): Bi-LSTM,BLE+WiFi 融合,1.3 m
优势:天然融入时间平滑,适合移动场景。 劣势:需要连续时间序列训练数据;对锚点变化敏感。
适用性评估:⚠️ 移动场景有参考价值,但需解决动态锚点问题。
2.5 Transformer
原理:自注意力机制捕获信标间空间关系,无需假设固定拓扑。
代表工作:
- Alhomayani & Mahoor (2023): Transformer encoder,WiFi 定位,注意力权重可解释
- 2024+ 新兴方向:set-based Transformer 处理变长输入
优势:
- 自注意力天然处理变长输入(好心人数量可变)
- 能学到信标间相对重要性
- 可解释性(attention weights ≈ 学到的权重 w_i)
劣势:数据需求大;计算成本高。
适用性评估:✅ 值得关注。Set Transformer 架构天然适合众包场景的变长输入。
2.6 GNN(图神经网络)
原理:将好心人和目标建模为图节点,RSSI 为边特征,通过消息传递学习定位。
Graph:
Nodes: 好心人 {位置, 设备特征} + 目标 {待估计位置}
Edges: RSSI 观测值
→ GNN message passing → 目标位置估计
代表工作:
- Yan et al. (2021): GNN 用于 WiFi 指纹定位,学习 AP 间拓扑关系
- 2023+: 动态图网络适应节点增减
优势:
- 天然处理图结构数据(众包场景天然是图)
- 对节点数量变化鲁棒
- 能利用好心人间的相对关系
劣势:图构建方式需设计;训练数据获取难。
适用性评估:✅ 高度适合。众包场景天然是图结构问题。
3. 概率学习方法
3.1 Gaussian Process Regression (GPR)
原理:将 RSSI 场建模为高斯过程,给出位置估计 + 不确定性。
优势:
- 同时输出位置估计和置信区间
- 小数据集表现好(不需要大量标注)
- 核函数可编码物理先验(如距离衰减)
劣势:
- 计算复杂度 O(N³),N 为训练样本数
- 高维输入性能下降
代表工作:
- Bekkali et al. (2011): GPR + BLE RSSI,2.1 m
- Richter & Toledano-Ayala (2015): 稀疏 GPR 加速,适用于在线定位
适用性评估:✅ 值得考虑。不确定性量化可直接用于权重 w_i 设计。
3.2 Bayesian Neural Network (BNN)
原理:权重为分布而非点估计,输出带不确定性的预测。
优势:不确定性量化 + 深度学习的表达能力。 劣势:训练复杂(变分推断或 MCMC),推断慢。
适用性评估:⚠️ 理论价值高,工程实现复杂。
4. 混合方法(模型 + 数据)★ 重点
4.1 可学习路径损耗模型
原理:保留 的结构,但用数据学习参数。
| 方案 | 学什么 | 方法 |
|---|---|---|
| 参数回归 | A, n 的全局最优值 | 最小二乘 / MLE |
| 分段学习 | 不同距离段的 n | 分段回归 |
| 神经路径损耗 | f(RSSI, context) → d | 小型 NN 替代解析公式 |
| 环境自适应 | n(环境特征) | 元学习 / 迁移学习 |
代表工作:
- Zuo et al. (2018): 在线学习路径损耗参数,精度提升 30%
- Li et al. (2020): 注意力网络预测环境相关的 n 值
适用性评估:✅ 强烈推荐。完美契合题目优化框架,只需将 f(r) 从固定模型改为可学习模型。
4.2 可学习权重 w_i
原理:用小网络预测每个观测的可靠性权重。
Input: [RSSI_i, variance_i, SNR_i, device_type_i, ...] → MLP → w_i
特征候选:
- RSSI 短时方差(高方差 → 多径严重 → 低权重)
- 信号强度(近距 → 高权重)
- 好心人自身定位精度(accuracy 字段)
- 设备类型编码
- 采样数量
适用性评估:✅ 强烈推荐。直接嵌入题目优化公式,实用且可解释。
4.3 Physics-Informed Neural Network (PINN)
原理:损失函数中加入物理约束项。
物理约束示例:
- 距离非负:
- 路径损耗单调递减:
- 三角不等式:好心人间距离约束
- 速度约束(移动场景):
适用性评估:✅ 适合作为创新点,将物理知识编码到学习框架中。
4.4 残差校正 (Residual Correction)
原理:两阶段方法。
阶段 1: 传统优化 → 粗定位 x̂₀
阶段 2: NN(x̂₀, RSSI 向量, 好心人位置) → Δx(残差)
最终: x̂ = x̂₀ + Δx
优势:
- 传统方法提供合理初始估计
- NN 只需学习小的修正量(学习任务更简单)
- 即使 NN 失效,仍有传统方法兜底
适用性评估:✅ 强烈推荐。风险低,增量改进明确,易于评估贡献。
5. 方法对比总表
| 方法 | 适合众包 | 需标注数据 | 精度提升潜力 | 可解释性 | 工程复杂度 | 本项目适用性 |
|---|---|---|---|---|---|---|
| 指纹法 | ❌ | 大量 | 高 | 中 | 中 | ❌ |
| DNN 回归 | ❌ | 大量 | 高 | 低 | 中 | ❌ |
| CNN | ❌ | 大量 | 高 | 低 | 高 | ❌ |
| LSTM | ⚠️ | 中等 | 中 | 低 | 中 | ⚠️ 移动场景 |
| Transformer | ✅ | 大量 | 高 | 中 | 高 | ✅ |
| GNN | ✅ | 中等 | 高 | 中 | 高 | ✅ |
| GPR | ✅ | 少量 | 中 | 高 | 中 | ✅ |
| 可学习 f(r) | ✅ | 少量 | 中 | 高 | 低 | ✅✅ |
| 可学习 w_i | ✅ | 少量 | 中 | 高 | 低 | ✅✅ |
| PINN | ✅ | 少量 | 中高 | 高 | 中 | ✅ |
| 残差校正 | ✅ | 少量 | 中 | 高 | 低 | ✅✅ |
6. 推荐方案路线
最佳策略:混合方法(保留优化框架 + 数据增强)
推荐方案层次:
Baseline: 固定 f(r) + 均匀 w_i + 非线性优化(WLS)
↓ +5-10% 精度提升
Tier 1: 可学习 f(r) + 可学习 w_i + 非线性优化
↓ +5-10% 精度提升
Tier 2: Tier 1 + 残差 NN 校正
↓ +3-5% 精度提升
Tier 3: Tier 2 + PINN 物理约束 / GNN 空间建模
理由
- 契合题意:题目给定优化框架,混合方法是最自然的扩展
- 数据高效:众包场景标注数据有限,混合方法只需少量数据
- 可解释:保留物理模型,每一步改进都可度量
- 风险可控:逐层叠加,每层都有独立价值
- 创新性:可学习权重 + 残差校正在 BLE 众包定位中文献较少
7. 关键文献方向
| 方向 | 关键词 | 代表期刊/会议 |
|---|---|---|
| BLE 指纹定位综述 | BLE fingerprint survey | IEEE CST, Sensors |
| 深度学习定位 | deep learning indoor localization | IEEE IoT-J, TMC |
| 众包定位 | crowdsourced localization | ACM UbiComp, MobiSys |
| 物理信息网络 | physics-informed positioning | IEEE TWC, TVT |
| 鲁棒定位 | robust localization NLOS | IEEE TSP, TAES |
| 路径损耗学习 | learned path loss model | IEEE WCL, VTC |
8. 本项目不适用方法及原因
| 方法 | 不适用原因 |
|---|---|
| 指纹法 | 众包场景无固定锚点,无法预建指纹库 |
| 固定拓扑 CNN | 好心人数量和位置每次不同 |
| 纯端到端 DNN | 缺乏大规模标注数据;泛化性差 |
| 强化学习 | 无交互式探索机会(离线处理) |
| 迁移学习(跨场景) | 众包场景本身缺乏稳定源域 |