❶ 如何使用geo数据库分析基因表达与预后的关系

在NCBI的GEO数据库中,系列(series)中matrix目录下的GSExxx_series_matrix.txt.gz文件,其中的数据是什么含义。是不是别人已经标准化好的数据(而且是log2处理过的),我可以用来直接求倍数然后看表达差异?
GSExxx_series_matrix.txt.gz数据格式和楼主的数据截图类似,差别在于列标题,楼主的列标题是GSMxxxxxx.CEL,而从GEO下载的GSExxx_series_matrix.txt.gz的数据,列标题是GSMxxxxxx,无“.CEL”。

ID_REF GSM413894 GSM413895 GSM413896 GSM413897 GSM413898 GSM413899 GSM413900 GSM413901
AFFX-BioB-3_at 8.472861 7.58379 7.726437 7.808923 8.604332 8.60782 8.343771 8.628157
AFFX-BioB-5_at 8.65537 7.696443 7.996466 7.719412 8.770542 8.652599 8.404749 8.911979
AFFX-BioB-M_at 8.813823 7.890245 8.127718 8.306655 9.011187 8.91993 8.566244 9.06862
AFFX-BioC-3_at 9.633732 9.024885 9.136383 9.120244 10.2995 10.15661 10.00954 10.25113
AFFX-BioC-5_at 9.756588 9.118516 9.137075 9.544678 9.945514 9.793713 9.544567 9.861975
AFFX-BioDn-3_at 12.0726 11.67344 11.62215 11.9874 12.16764 11.97144 11.81811 12.0963