From: Davies L. <dav...@gm...> - 2015-07-23 20:30:27
|
每到整点的时候,master 会fork一个子进程把内存中的数据快照到磁盘,如果数据量小或者磁盘很快,是不会影响master的响应的。 一旦数据比较大或者磁盘很忙时(并且master还有很多访问),写快照的进程会让磁盘变得繁忙,导致另一个master进程在写changelog 时被阻塞了。 改进办法是使用更好的磁盘(SSD)或者更多内存(使得新写的快照不必立即刷新到磁盘)。 2015-07-21 18:27 GMT-07:00 刘亚磊 <liu...@eb...>: > mfs版本:2.0.72社区版 > master、chunkserver、dataserver、client操作系统:centso 5.9 x64 > > 问题描述: > 文件数量千万级,发现mfs集群master每到正点会失去响应1-2分钟。master内存、cpu、硬盘、网络监控正常。最开始使用的是1.6.25版本,怀疑软件自身存在bug,后来升级到2.0.72社区版,问题依然存在。以下是正点的错误日志: > > > Jul 22 07:00:00 mfsmaster1 mfsmaster[22443]: fork error (store data in > foreground - it will block master for a while): ENOMEM (Cannot allocate > memory) > Jul 22 07:01:47 mfsmaster1 mfsmaster[22443]: csdb: found cs using ip:port > and csid (192.168.1.82:9422,5), but server is still connected > Jul 22 07:01:47 mfsmaster1 mfsmaster[22443]: can't accept chunkserver (ip: > 192.168.1.82 / port: 9422) > > ________________________________ > 刘亚磊 | 买卖宝信息技术有限公司 > 北京市朝阳区红军营南路傲城融富中心C座三层(100012) > 直线: (86) 10 56716100-8995 > 电子邮件: liu...@eb... | 移动电话: (86) 18801039545 > > ------------------------------------------------------------------------------ > > _________________________________________ > moosefs-users mailing list > moo...@li... > https://lists.sourceforge.net/lists/listinfo/moosefs-users > -- - Davies |