t-SNE

習題預習

User ask:
給我5題t-SNE的中文問題

ChatGPT answer:

User ask:
以中文說明t-SNE並舉例

ChatGPT answer:

t-SNE是一種降維技術，能夠將高維度的數據轉換為低維度的數據，同時保持原始數據之間的關係和相似度。它可以繪製出具有可視化效果的數據圖形，這些圖形可以幫助我們更好地理解數據之間的關係。

例如，假設有個數據集，其中包含了很多關於動物的信息，例如種類、體型、食性等等。透過t-SNE降維，可以將這些數據轉換為二維空間中的點，並將相似的數據點放在附近，不相似的數據點放在遠處，從而形成一個具有可視化效果的動物分類圖形。這樣我們就可以更清晰地看到各種不同動物之間的相似度和關係了。

User ask:
以中文條列t-SNE的重點

ChatGPT answer:

User ask:
以中文給我5題t-SNE的中等難度問題，並在後面列出答案

ChatGPT answer:

答案：

t-SNE是一種基於機器學習的降維技術，它可以將高維度的資料降低到二維或三維的空間，使得人們可以更好地理解和可視化資料。透過嵌入學習和維度的轉換，t-SNE能夠在保留高維空間中的資料特徵的同時，讓其在低維空間中的分佈更加均勻、相似。
優點：t-SNE在降維的同時，能更好地呈現資料之間的相似度；對於複雜的資料集有很好的效果；具有較強的可視化效果。缺點：計算時間較長，需要較大的計算資源；降維後的資料可能會失去原始資料的某些特徵。
主要參數有兩個，分別是「perplexity」和「learning rate」。perplexity指出了附近的點應作為考慮相對於每個點的數量。learning rate則是直接關係到和當前梯度的距離。調整這些參數可以更好地控制t-SNE的效果。
缺失值的處理：可以透過填補缺失值的方法，如平均值替換、插值法等。離群值的處理：可以使用一些現成的離群值檢測方法，如局部敏感哈希、基於密度的局部離群值等。或者，可以使用更高的perplexity來減輕離群點的影響。
可以透過定性和定量的方式來幫助評估t-SNE的降維效果。定量的方法包括單調性和穩定性的分析；定性的方法包括視覺比較和對比原始和降維資料的分佈等。