Neden “doğruluk” tek bir sayı değildir?
Bir uyku takibi giyilebilir cihazı “doğru mu?” sorusu, çoğu zaman tek bir puanla (ör. sleep score) yanıtlanmaya çalışılır. Oysa uyku ölçümü birden fazla çıktıyı içerir: uykuya dalma zamanı, toplam uyku süresi, gece içi uyanıklıklar (WASO), yatakta geçirilen süre, uyku verimliliği ve bazı cihazlarda uyku evreleri. Bu nedenle testin ilk adımı, hangi çıktının doğruluğunu ölçeceğinizi tanımlamaktır.
Klinik ölçüm ve validasyon tarafında, polisomnografi (PSG) uyku evrelemede karşılaştırma için yaygın biçimde “referans” kabul edilir. Tüketici teknolojileri için hazırlanan kaynaklarda da klinik tanı yerine geçmemesi ve doğrulama/şeffaf raporlama ihtiyacı vurgulanır; bu çerçeve test planınızı gerçekçi tutmanıza yardımcı olur. Kaynak: AASM – Emerging Technology.
Önce hedefi netleştirin: Hangi doğruluk, hangi senaryo?
1) Temel hedef: uyku–uyanıklık ayrımı mı, yoksa evreler mi?
Bazı giyilebilir ve actigraphy tabanlı yaklaşımlar uyku/uyanıklık ayrımında pratikte işe yarayabilir; ancak özellikle uyanıklığı yakalama (kısa gece içi uyanmalar) ve uyku evreleri gibi daha ince ayrımlarda performans cihaz/algoritma ve popülasyona göre değişebilir. Literatür, algoritma ayarlarının ve popülasyonun sonuçları ciddi biçimde etkilediğini ve bazı ölçümlerin (özellikle WASO ve uyanma sayıları) daha değişken olabildiğini göstermektedir (bkz. J Sleep Res, JMIR Formative Research).
2) Kullanım bağlamı: ev rutini mi, tek gece laboratuvar mı?
Tek gecelik bir kayıt pratik olmakla birlikte her zaman “tipik” bir geceyi temsil etmeyebilir. Bazı çalışmalar çoklu gece kayıtlarının ve/veya ev ortamı kayıtlarının daha doğru veya daha genellenebilir sonuçlar verdiğini bildirmektedir; yine de bunun gerekliliği çalışmanın amacına, popülasyona ve kaynaklara bağlıdır. AASM de tüketici uyku teknolojilerini değerlendirirken tasarımın ve raporlamanın şeffaf olmasını önerir.
3) Popülasyon: sağlıklı yetişkin mi, uyku şikâyeti olan kişiler mi?
Hipersomnolans, ciddi insomnia veya diğer uyku bozukluğu şüphesi olan popülasyonlarda giyilebilir performansı sağlıklı kişilerdekinden farklı olabilir; bu nedenle test popülasyonunuzun özelliklerini açıkça tanımlayın ve gerektiğinde alt grup analizleri planlayın.
Altın standart ve pratik referanslar: PSG ve actigraphy nerede durur?
PSG, çok kanallı fizyolojik sinyallerle (ör. EEG/EOG/EMG) uyku evrelerini skorlama imkânı sunduğu için uyku evrelemede güçlü bir referanstır. Buna karşılık, actigraphy (genellikle ivmeölçer tabanlı) günlük yaşamda uzun süreli kayıt için pratiktir ve birçok giyilebilir cihazın “hareketten uyku” yaklaşımını temsil eder.
Bu rehberin protokolü, mümkünse PSG’yi referans alır; PSG’ye erişim yoksa “kısmi doğrulama” yaklaşımıyla daha sınırlı hedefler (ör. tutarlılık, cihazlar arası uyum) değerlendirilmelidir. AASM, tüketici cihazlarının klinik tanı amacıyla doğrudan kullanılmaması gerektiğini ve metodoloji ile raporlamada şeffaflık gerektiğini vurgular.
Giyilebilir uyku doğruluğu test protokolü (adım adım)
Not: Aşağıdaki adımlar, yayınlanabilir bir doğrulama raporu yazmak veya bir ürün incelemesinde metodolojik tutarlılık sağlamak için tasarlanmıştır. Bu rehber tıbbi tavsiye değildir ve klinik tanı yerine geçmez.
Adım 0 — Test sorusunu yazılı hale getirin
- Birincil çıktı: Uyku/uyanıklık mı (epoch-seviyesi), TST/SE/WASO mu, yoksa evreleme mi?
- Karşılaştırma: PSG (tercih), taşınabilir PSG (varsa), ya da sınırlı hedeflerle alternatif referanslar.
- Kullanım şekli: Bilek/kol, hangi bilek, gece boyunca kesintisiz mi?
- Zaman ufku: Tek gece vs çoklu gece — tek gece sonuçları sınırlı olabilir; mümkünse çoklu gece tasarımları tercih edilmesi önerilir.
Adım 1 — Cihaz ve yazılım sürümünü “kilitleyin”
Tüketici cihazlarında algoritmalar zamanla güncellenebilir. Bu nedenle raporunuza şunları ekleyin:
- Cihaz modeli ve donanım revizyonu (biliniyorsa)
- Uygulama sürümü
- Ürün yazılımı (firmware) sürümü
- Uyku algoritması sürümü/uyku tespiti modu (varsa)
Şeffaf raporlama ihtiyacı kılavuz niteliğindeki kaynaklarda ve algoritma validasyon çalışmalarında vurgulanır (AASM, JMIR).
Adım 2 — Kayıt tasarımını seçin (asgari uygulanabilir seçenekler)
Seçenek A: Eşzamanlı PSG + giyilebilir (en güçlü tasarım)
- Aynı gecede PSG ve giyilebilir eşzamanlı kayıt.
- Ev ortamına uygun taşınabilir PSG varsa, laboratuvar etkisini azaltmak için değerlendirin.
Seçenek B: Çoklu gece actigraphy + sınırlı PSG
- En az bir gecede eşzamanlı PSG, ve mümkünse ek gecelerde yalnızca giyilebilir/actigraphy kaydı.
- Bu yaklaşım günlük değişkenliği yakalamanıza yardımcı olabilir; kaç gece gerektiği çalışmanın hedeflerine ve kaynaklara bağlıdır.
Seçenek C: PSG yoksa (kısmi doğrulama)
- PSG erişimi yoksa tutarlılık (ör. aynı kişinin ardışık gecelerde cihaz çıktılarının stabilitesi) ve cihazlar arası uyum üzerine odaklanın.
- Uyku evreleri iddialarını kesinlikle belirtmeyin; evreleme çıktıları varsa bunların sınırlılıklarını açıkça yazın.
Çoklu gece tasarımlarının avantajları ve gerekliliği literatürde tartışılmaktadır; karar kaynaklar ve çalışma hedefleri doğrultusunda verilmeli ve raporda açıklanmalıdır.
Adım 3 — Zaman senkronizasyonu ve epoch ayarı
Karşılaştırma yapabilmek için zaman hizalaması kritiktir:
- Saat eşitleme: PSG sistemi ve giyilebilir aynı referans saate senkronlansın.
- Epoch uzunluğu: PSG skoru ile aynı epoch uzunluğunu hedefleyin (cihaz dışa aktarıyorsa).
- Başlangıç/bitiş kuralları: “Yatış” ve “kalkış” penceresini nasıl tanımladığınızı yazın.
Epoch, algoritma ve veri temizleme kurallarının açık raporlanması, validasyon literatüründe özellikle vurgulanan bir şeffaflık gereğidir (JMIR).
Adım 4 — Kullanım standardizasyonu (giyilebilir için)
- Aynı bilekte takma (sol/sağ) ve bunu raporda belirtme.
- Kayışı çok gevşek olmayacak şekilde standardize edin; temas kesildiğinde bunları notlayın.
- Gece şarj/çıkarma/otomatik kilit gibi cihaz davranışlarını kayda geçirin.
- Kısa bir uyku günlüğü (yaklaşık yatış/kalkış, gece cihazı çıkarma, gündüz şekerlemeleri) tutulması faydalıdır.
Adım 5 — Veri dışa aktarma ve veri sözlüğü oluşturma
Analize başlamadan önce hangi alanın ne anlama geldiğini netleştirin:
- TST (Total Sleep Time), SE (Sleep Efficiency), WASO (Wake After Sleep Onset) tanımlarını veri kaynağına göre yazın.
- Eğer cihaz uyku evreleri veriyorsa: evre etiketlerini ve üreticinin bu etiketleri nasıl ürettiğine dair açıklamalarını ekleyin (varsa).
- Sleep score varsa: puanın bileşenleri açıklanmıyorsa bunu açıkça not edin.
AASM, tüketici uyku teknolojilerinde sonuçların klinik anlamı ve şeffaflık konusunda temkinli yaklaşımı vurgular.
Analiz planı: Hangi metrikler neyi anlatır?
Uyku doğruluğu değerlendirmesinde tek bir metrik yeterli değildir. Epoch-seviyesi sınıflandırma metrikleri ile gece-özet metrikleri (TST/SE/WASO) birlikte değerlendirilmelidir. Literatürde ve validasyon çalışmalarında sıkça raporlanan ve önerilen ölçümler arasında sensitivity / specificity, Cohen κ, ICC ve Bland–Altman analizleri yer alır; bu yöntemlerin seçimi çalışmanın hedeflerine, veri yapısına ve popülasyona göre yapılmalıdır (bkz. JMIR Formative Research).
| Metrik |
Ne için kullanılır? |
Pratik yorum |
| Epoch-seviyesi sensitivity/specificity |
Uyku/uyanıklık (veya evre) sınıflandırmasının doğruluğu |
Bir cihaz uyku epochlarını iyi yakalayıp uyanıklığı kaçırabilir; bu, WASO'u olduğundan düşük gösterebilir. Bu davranış cihaz/algoritma ve popülasyona göre değişebilir. |
| Cohen κ |
Şansa bağlı uyumu düzelterek sınıflandırma uyumu |
Özellikle sınıf dağılımı dengesizken (çoğu epoch uyku) daha anlamlı olabilir. |
| ICC |
Sürekli ölçümlerde (TST/SE/WASO) cihazlar arası tutarlılık |
Yüksek ICC, bireyleri göreli olarak sıralamada iyi olabileceğini gösterir; mutlak farklar yine de önemlidir. |
| Bland-Altman |
İki yöntem arasındaki farkların dağılımı ve olası yanlılık |
Ortalama fark ve saçılma, “sistematik olarak fazla/az ölçme” eğilimini gösterebilir. |
Epoch-seviyesi değerlendirme: Basit bir karşılaştırma iskeleti
1) Uyku/uyanıklık için karışıklık matrisi (confusion matrix)
PSG’yi referans alarak her epoch için “uyku” ya da “uyanık” etiketini karşılaştırın. Bu yaklaşım, actigraphy tabanlı yöntemlerin güçlü ve zayıf yanlarını daha net görmenizi sağlar. Yayınlar genelde uyku epochlarını yakalamanın daha kolay olduğunu, uyanıklık epochlarının ise cihaz/algoritma ve popülasyona göre daha değişken olduğunu göstermektedir (J Sleep Res, JMIR).
2) Uyku evreleri için: temkinli raporlama
Eğer giyilebilir cihaz “REM/Light/Deep” gibi evreler veriyorsa:
- Evreleri PSG evreleriyle bire bir eşleştirebildiğinizi varsaymayın; eşleme kuralınızı açıkça yazın.
- Evre doğruluğunu raporlarken sınıf dengesizliğini göz önünde bulundurun (bazı evreler daha az görülür).
- Üretici algoritması kapalıysa, sonuçların yorumunda belirsizliği açıkça belirtin; evreleme performansı sensör seti ve algoritmaya göre önemli ölçüde değişebilir.
Tüketici uyku teknolojilerinde evreleme çıktılarının klinik PSG ile güçlü uyum göstermeyebileceği ve algoritma şeffaflığının bir zorluk olabildiği kılavuzlarda tartışılmaktadır (AASM).
Gece-özet metrikleri: TST, SE, WASO nasıl test edilir?
Çoğu kullanıcı için pratikte en önemli çıktılar gece sonunda görülen özet değerlerdir (TST, SE, WASO). Bu metriklerde iki yaklaşım önerilir:
- Mutlak fark analizi: PSG ile cihaz arasındaki farkların dağılımını (ör. Bland–Altman) raporlamak.
- Tutarlılık analizi: ICC gibi ölçülerle, cihazın kişileri göreli olarak düzgün sınıflandırıp sınıflandırmadığını değerlendirmek.
Bu çerçeve literatürde yaygın olarak önerilmektedir; hangi metriklerin öncelikli olduğu çalışmanızın amaçlarına bağlıdır (JMIR).
Veri temizleme ve dışlama kuralları (önceden belirleyin)
Sonuçların güvenilir olması için dışlama/temizleme kuralları önceden tanımlanmalıdır. Önerilen içerik:
- Eksik kayıt: Cihaz gece içinde çıkarıldıysa veya veri kaybı olduysa bunları nasıl ele alacağınızı belirtin.
- Zaman kayması: Saat drift’i tespit ederseniz düzeltme yönteminiz ne olacak?
- Uyku penceresi: Analize dahil edeceğiniz zaman aralığını (yatakta kalma penceresi) nasıl belirleyeceksiniz?
- Algoritma sürümü değişimi: Test sürecinde uygulama/firmware güncellendiyse hangi adımları atacağınızı önceden yazın.
Epoch ayarı, algoritma sürümü ve veri işleme kurallarının açıkça raporlanması şeffaflık açısından önemlidir (AASM, JMIR).
Raporlama şablonu: Bir doğrulama/inceleme yazısında neleri açıklamalısınız?
- Katılımcılar: Yaş aralığı/temel özellikler, dahil etme-dışlama kriterleri.
- Kurulum: Cihaz konumu (hangi bilek), PSG tipi, eşzamanlı kayıt yöntemi.
- Yazılım/algoritma: Sürümler ve ayarlar (kesin bir eşleme yapmak için bunları belirtin).
- Epoch ve zaman hizalaması: Hangi epoch, nasıl senkronize edildi.
- Birincil ve ikincil metrikler: Önceden belirlenmiş metriklerin (ör. epoch-seviye sensitivity/specificity, Cohen κ, ICC, Bland–Altman) listesini verin; bu metrikler yaygın olarak kullanılır ancak zorunlu değildir.
- Sonuçların sunumu: Hem epoch-seviyesi (duyarlılık/spesifisite/κ) hem de özet metriklerde (Bland–Altman/ICC) bulguları sunun.
- Sınırlılıklar: PSG sayısı (tek gece/çoklu gece), evreleme belirsizliği, popülasyon temsili gibi konuları açıkça tartışın.
Yaygın hatalar (ve nasıl önlenir?)
- Tek geceden genelleme: Uyku geceden geceye değişebilir; sonuçlarınızı “bu koşulda” diye çerçeveleyin.
- Sleep score’a aşırı güven: Puanın bileşenleri açıklanmıyorsa, bilimsel karşılaştırma zorlaşır; temel metriklere (TST/SE/WASO) odaklanın.
- Uyku evrelerini kesinlik gibi sunma: Evrelerin PSG ile uyumu değişken olabilir; iddiaları temkinli yazın.
- Algoritma sürümünü raporlamama: Aynı cihaz farklı sürümlerde farklı sonuç verebilir; sürüm bilgisiz karşılaştırma zayıflar.
Sonuçları nasıl yorumlamalısınız? (Kullanıcı odaklı okuma)
Testiniz sonunda şunları ayırmaya çalışın:
- Uyku süresi ve zamanlama takibi: Cihaz, “ne zaman uyudum/ne zaman uyandım” sorusunu tutarlı yanıtlıyor mu?
- Gece içi uyanıklık: Uyanıklık tespitinin zor olabileceği literatürde sıkça tartışılır; WASO ve uyanma sayılarında temkinli olun — performans cihaz/algoritma ve popülasyona göre değişebilir.
- Uyku evreleri: Evreleri eğitim amaçlı içgörü olarak sunmak, klinik anlam yüklemekten daha güvenlidir (AASM önerileriyle uyumlu bir yaklaşım).
Eğer belirgin gündüz aşırı uyku hali, horlama/nefes durması şüphesi veya uzun süreli uyku sorunları varsa, giyilebilir verilerini tek başına tanı aracı gibi kullanmak yerine bir sağlık profesyoneliyle görüşülmesini önerin.
Satın alma ve kullanım için hızlı kontrol listesi
- Şeffaflık: Üretici doğrulama çalışmalarını ve kullanılan metrikleri açıkça paylaşıyor mu?
- Veri erişimi: Epoch-seviyesi veya ayrıntılı veri dışa aktarımı mümkün mü?
- Güncellemeler: Algoritma güncellemeleri sonrası değişiklik notları yayınlanıyor mu?
- Amaca uygunluk: Hedefiniz uyku süresi/tutarlılık mı, yoksa evre ayrıntısı mı?
Kısa özet
Bir giyilebilir uyku cihazını test etmek, “puan doğru mu?” sorusundan çok daha fazlasıdır. En iyi yaklaşım, mümkünse PSG’yi referans alarak ve çalışmanın hedeflerine uygun şekilde hem epoch-seviyesi hem de gece-özet metriklerde şeffaf, tekrarlanabilir bir analiz planı yürütmektir. Cihaz performansı cihaz/algoritma ve popülasyona göre değişebileceği için bulguları temkinli ve bağlama bağlı olarak yorumlayın.
Kaynakça
- Emerging Technology — American Academy of Sleep Medicine (AASM), 2026.
- Actigraphy against 32‑hour polysomnography in patients with suspected idiopathic hypersomnia — Journal of Sleep Research (2025).
- Comparison and Validation of Actigraphy Algorithms Using a Large Community Dataset: Algorithm Validation Study — JMIR Formative Research (2025).
Yorumlar