#系统设计 , 当用户大规模增长的情况, 需要超大规模的存储的情况下, 如何处理?
是否可以考虑设计一个完全独立的 etcd-data-sync 服务, 主要用来同步把历史数据在分布式数据库存储,也就是说作为中间件或者说etcd适配器的数据同步服务存在, 检测 etcd 数据大小,当etcd数据量超过一定大小的时候, 由 etcd-data-sync 自动的将历史数据同步到分布式数据库存储, 然后 etcd 清理历史数据
比如 Amazon DynamoDB 作为系统的大规模存储, 而这种存储服务本身也内置缓存:DynamoDB Accelerator (DAX)
比如lln 有了超大用户的规模后, weblln 可以在 cloudflare 部署, lln 可以多副本扩展部署, etcd 可以几台大配置的裸金属机器集群部署, etcd-data-sync 作为独立系统部署负责监测 etcd 数据大小,自动的同步数据在分布式数据库存储, 这样可以满足系统既快,存储又大的业务场景, 而且当前系统业务也不需要把数据存取再重新设计一遍
很多关于数据处理的业务场景,就可以独立设计,比如数据分析,全局搜索等等, 当然业务细节还有很多地方需要考虑