环境:4台普通pc,redhat el5, 互联带宽100Mbps。
sector版本:2.0 release 和3.2日checkout的svn
snapshot,sysinfo见帖子末尾,基本上采用缺省配置,启动方式全部为手工启动;测试时均采用FUSE mount成本地目录。
2.0 release碰到的问题:
1. 碰到一次master因为Segment fault退出,没有生成core dump;
2. master log里边显示曾经有一个slave退出;不过那个节点的slave进程一直还在。
然后切换到snapshot版本进行测试,也发现一些问题:
1. slave 杀掉后重启,报slave join rejected. code: -102;只能重启master才能连上;
2. vi一个几k的txt,第一次经常要等10s左右才能打开;如果退出再执行就很快,看来已经cache到本地;
3. 用FUSE经常出现某个目录不能操作,只能强制umount;比如一次测试是我test目录下有600多个子目录,每个子目录里有几个文件;我执行rm -Rf test后,等待很长时间(至少一分钟)才返回:
rm -Rf /root/export/test
rm: reading directory `/root/export/test': Operation not permitted
然后有可能这个目录就再也不能正常访问了。
我看svn上有JNI接口的java client实现,不知道现在是否比较成熟?
谢谢,
附上sysinfo打出来的信息:
./sysinfo
Sector System Information:
Running since Tue Mar 2 17:41:55 2010
Available Disk Size 344123 MB
Total File Size 2.618 MB
Total Number of Files 187
Total Number of Slave Nodes 4
MASTER ID IP PORT
1: 192.168.0.217 6000
Total number of clusters 2
Cluster_ID Total_Nodes AvailDisk(MB) FileSize(MB) NetIn(MB) NetOut(MB)
0: 0 0 0 0 0
1: 4 344123 4.69893 0 0
SLAVE_ID IP TS(us) AvailDisk(MB) TotalFile(MB) Mem(MB) CPU(us) NetIn(MB)
NetOut(MB)
1: 192.168.0.217 1267582083217379 67653 1.30203 109.98 4530000 0.0048542 0
2: 192.168.0.216 1267582074283918 141249 0.707703 108.984 1890000 0.0449877
0.00201893
3: 192.168.0.218 -1 68012.6 2.07994 0 0 0 0
4: 192.168.0.215 1267582077371676 67208.2 0.609262 109.184 510000 0.00671864 0