📅 2026-04-16🤖 claude-opus-4-20250514datasetblerssipositioningbenchmark

BLE RSSI 定位公开数据集调研

1. 可用数据集

1.1 Position-Annotated BLE RSSI Dataset ⭐⭐⭐

字段 内容
URL https://github.com/philotuxo/Position-Annotated-BLE-RSSI-Dataset
描述 分布式 BLE 传感器的 RSSI 数据,配备基于 AR-tag 双相机视觉定位的高精度真值(~0.04 m 中位精度)
数据 RSSI 读数、真值位置、概率射频地图(Wasserstein 插值)、占用地图、传感器配置
更新 2024 年 12 月
许可 CC0-1.0(公共领域)
匹配度 分布式 BLE 传感器 + 高精度真值,最接近 Problem 1 的优化场景

1.2 Kaggle Indoor Location & Navigation Competition ⭐⭐⭐

字段 内容
URL https://www.kaggle.com/competitions/indoor-location-navigation
描述 微软研究院举办的智能手机室内定位竞赛,多场地多楼层
数据 BLE iBeacon RSSI(UUID, Major/Minor, TxPower, RSSI, distance) + WiFi RSSI + IMU(加速度计、陀螺仪)+ 磁力计 + 楼层平面图
规模 多场地,GB 级
年份 2021
格式 带时间戳的 TXT 传感器轨迹 + 楼层图(PNG)+ 元数据(JSON, GeoJSON)

1.3 Indoor Location Competition 2.0

字段 内容
URL https://github.com/location-competition/indoor-location-competition-20
描述 Kaggle 竞赛的后续版本,传感器数据更丰富
数据 WiFi RSSI/SSID/BSSID + BLE iBeacon + IMU + 磁力计
规模 2 个场地,多楼层
年份 2021

1.4 UCI BLE RSSI Dataset (iBeacon) ⭐⭐

字段 内容
URL https://archive.ics.uci.edu/ml/datasets/BLE+RSSI+Dataset+for+Indoor+localization+and+Navigation
描述 西密歇根大学 Waldo 图书馆中 13 个 iBeacon 的 RSSI 读数
数据 BLE RSSI 值(-200 = 超出范围)、位置网格标签、时间戳
规模 6,611 条(1,420 有标签 + 5,191 无标签),15 个特征,145 KB
年份 2017–2018
格式 CSV
适用 简单干净,适合初步算法验证

1.5 UCI BLE RSSI Dataset (iTAG) ⭐⭐

字段 内容
URL https://archive.ics.uci.edu/dataset/607
描述 智能手机对 BLE 设备(iTAG)的 RSSI 测量与位置追踪
数据 BLE RSSI、设备位置标签
规模 23,570 条,5 个特征
年份 ~2020–2021
适用 手机→BLE 设备方向,最接近"找设备"场景

1.6 UJIndoorLoc(WiFi 基线参考)

字段 内容
URL https://archive.ics.uci.edu/ml/datasets/UJIndoorLoc
描述 多建筑多楼层 WiFi 指纹数据集
数据 520 个 WiFi AP 的 RSSI + 建筑/楼层/位置标签
规模 21,048 条,529 个特征
年份 2014
注意 仅 WiFi(无 BLE),但广泛用作室内定位研究基线

2. "找设备"相关资源

资源 URL 说明
OpenHaystack https://github.com/seemoo-lab/openhaystack Apple Find My 研究框架,可创建自定义 AirTag 类设备。关联论文 "Who Can Find My Devices?"(PETS 2021)研究了 Apple 众包 BLE 定位系统。无公开数据集,但提供自行采集数据的工具
Apple Find My Accessory Spec Apple 开发者文档 BLE 众包定位协议规范,可用于理解数据格式

3. 关键缺口

没有公开数据集完全复现 Problem 1 的场景:一个丢失的 BLE 设备 + 多个路过好心人手机各自报告 RSSI 和自身 GPS 位置。

4. 模拟策略

可基于现有数据集构造 Problem 1 测试场景:

  1. 基于 UCI/Kaggle 数据:取 BLE RSSI 读数作为基础,将每个信标位置视为"好心人位置",人工添加 GNSS 级噪声(σ = 5–15 m),构造 errors-in-variables 测试场景
  2. 完全合成:用对数距离路径损耗模型生成 RSSI,对 IiI_if(ri)f(r_i) 分别加噪,可控制信噪比、好心人数量、几何分布等参数
  3. 半实物:用 OpenHaystack 部署 BLE 设备,用多部手机采集真实数据