Мне кажется, что не стоит уходить в обсуждение терминологии (см.
https://ru.wikipedia.org/wiki/Разреженная_матрица). И в попытке перейти к конкретному примеру "Пару раз ткнуть мышкой и посмотреть, что получится - разве не интересно? Я бы сделал.", как предлагает "Игорь". Вопрос, на мой взгляд, глубже. Правильно заметил ИНО. "Это да, хрен найдёшь в литературе примеров коррекции значимости для корреляций в исследованиях, где проверяется парная корреляция всего со всем, а потом выбирается лишь то, что понравилось исследователю, зато самих таких исследований пруд пруди. Продуктивная статистика, мать ее!".
Проблема формулируется просто:
Посчитать парные непараметрические корреляции, при достаточно большом количестве входных параметров, которые содержат пропуски.
Но природа их такова (в моём случае): ПЦР реакции, где часть значений заведомо опускается из-за не значимости клинической(?).
При изучении микробиома человека (в частности женщины) методами параллельного секвенирования (секвенирование нового поколения, NGS) гена16S rRNA и
биоинформационный анализ полученных данных с классификацией ДНК по таксономическим единицам, где часть данных просто не обнаруживается существующими методами
NGS. (сотни параметров с пропущенными данными).
Таким образом природа "дырок" в данных носит не случайный характер, но в некотором смысле квазислучайный, а также преднамеренный (не хотелось бы уходить в обсуждение типов пропусков).
При подсчёте корреляций надо учесть множественность сравнений.
ВСЁ ОЧЕНЬ ПРОСТО!