A. 国内现在有哪几大数据

国内?现在几个主流的都是国外的吧 mysql 、sql server、 oracle

B. 哪一个新闻类app比较好

比较好的新闻类app有:腾讯新闻、南方周末、网易新闻、搜狐新闻、今日头条。下面分别来介绍这些APP。

1、腾讯新闻

网易新闻提供极具网易特色的新闻阅读、跟贴盖楼、图片浏览、话题投票、要闻推送、离线阅读、流量提醒等功能,实现比电脑上看新闻更方便的优异体验,充分满足超过1亿网易网友的手机新闻、娱乐、体育、财经、科技等多种资讯内容需求。

4、搜狐新闻

搜狐新闻客户端是搜狐公司出品的一款为智能手机用户量身打造的“订阅平台+实时新闻”阅读应用,通过将优质媒体资源聚合成适合方寸之间阅读的图文报纸并定时推送,让智能手机用户随时随地“搜狐新闻 先知道”。

5、今日头条

今日头条是北京字节跳动科技有限公司开发的一款基于数据挖掘的推荐引擎产品,为用户推荐信息、提供连接人与信息的服务的产品。由张一鸣于2012年3月创建,2012年8月发布第一个版本。基于个性化推荐引擎技术,根据每个用户的兴趣、位置等多个维度进行个性化推荐,推荐内容不仅包括狭义上的新闻,还包括音乐、电影、游戏、购物等资讯。

C. 请问中国最有影响力的数据库是哪个ISTIC、CNKI、维普

“中国知网”是集知识资源大规模整合出版、原创性学术文献出版、多媒体出版和专业化、个性化数字图书馆为一体的数字出版平台,全面整合了我国90%以上的学术文献和海外重要的学术文献数据库资源,文献类型包括:学术期刊、博士学位论文、优秀硕士学位论文、工具书、 重要会议论文、年鉴、专著、报纸、专利、标准、科技成果、知识元、哈佛商业评论数据库、古籍等;以网络出版和数字图书馆相结合的巨大优势,实现了知识资源的增值服务和学术文献的个性化与专业化的实时出版,面向全社会各行各业创新与创新管理提供知识管理服务。目前,《中国知识资源总库》中的各类文献资源已推广至海内外高等院校、政府、企事业单位、医疗卫生机构、情报服务机构以及农村等各个领域,带动了学术资源在党政领导机关管理决策、基础教育改革、城乡社区公共知识服务、农村文化建设中的大量普及与应用,产生了良好的社会效益和经济效益。为我国数字与网络出版产业的高速发展和国际化奠定了重要的基础。
CNKI工程
中国知识基础设施工程(China National Knowledge Infrastructure),简称CNKI工程,始建于1995年,是以实现全社会知识信息资源传播共享与增值利用为目标的国家信息化重点工程,由清华大学发起,同方知网技术产业集团承担建设,是“十一五”国家重大出版工程项目。
在党和国家领导以及教育部、中宣部、科技部、新闻出版总署、国家版权局、国家计委的大力支持下,在全国学术界、教育界、出版界、图书情报界等社会各界的密切配合和清华大学的直接领导下,同方知网技术产业集团经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成了超大型全文数据库《中国知识资源总库》,以“中国知网(www.cnki.net)”为网络出版与知识服务平台,通过产业化运作,为全社会知识资源高效共享提供丰富的知识信息资源和有效的知识传播与数字化学习平台。
“中国知网”的数字出版产品总称为《中国知识资源总库》,是一个采用符合国际、国家和行业技术标准的CNKI网络出版产品与技术服务标准,对各种文献资源进行规范化、标准化加工和集成化整合而成的超大型全文数据库。
其中,国家重点出版项目---《中国学术文献网络出版总库》,遵循“权威性文献检索工具、集成化增值性整合传播媒体、数字化学习与研究平台、智能化专业知识仓库、规范化学术文献与科研绩效评价工具、可二次开发的数字化资源战略馆藏”六大建设标准,按照知识网络建构模式,大规模集成整合了我国学术期刊、博硕士学位论文、会议论文、报纸、年鉴、工具书、学术图书、专利、标准、科技成果等各类文献资源,内容涵盖各学科、各行业领域,囊括基础研究、工程技术、高级科普、政策指导、行业指导、实用技术、职业指导、科技信息等各个层面,连续累积出版文献5600多万篇,并大量整合了互联网上外文科技资源。此外,《中国知识资源总库》还收录出版了大量高等教育、基础教育、党建、大众科普、政策法规、经济信息、大众文化、文艺作品类文献。尤其是基于《总库》的行业、专业与个性化数字图书馆,融合了各类先进的知识服务模式,为高效率创新、学习和管理决策创造了理想的信息化环境。

不管怎么样,有你自己需要的东西才是最实在的,来龙去脉没有必要搞清楚。

D. 大数据的网站有哪些包括知识类、新闻类、文献类等等。

目前好的网站没有多少哈,不过微信公众号上的文章还是有不少大数据公司在做的!内大数据文摘、腾容讯大数据、灯塔大数据等等吧,可以去搜狗的微信搜索搜搜,还是有不少课参考的。什么知网啊,这类的都太学术了,不落地。

E. 大数据常用哪些数据库

通常数据库分为关系型数据库和非关系型数据库,关系型数据库的优势到现在也是无可替代的,比如MySQL、SQL Server、Oracle、DB2、SyBase、Informix、PostgreSQL以及比较小型的Access等等数据库,这些数据库支持复杂的SQL操作和事务机制,适合小量数据读写场景;但是到了大数据时代,人们更多的数据和物联网加入的数据已经超出了关系数据库的承载范围。

大数据时代初期,随着数据请求并发量大不断增大,一般都是采用的集群同步数据的方式处理,就是将数据库分成了很多的小库,每个数据库的数据内容是不变的,都是保存了源数据库的数据副本,通过同步或者异步方式保证数据的一致性,每个库设定特定的读写方式,比如主数据库负责写操作,从数据库是负责读操作,等等根据业务复杂程度以此类推,将业务在物理层面上进行了分离,但是这种方式依旧存在一定的负载压力的问题,企业数据在不断的扩增中,后面就采用分库分表的方式解决,对读写负载进行分离,但是这种实现依旧存在不足,且需要不断进行数据库服务器扩容。
NoSQL数据库大致分为5种类型

1、列族数据库:BigTable、HBase、Cassandra、Amazon SimpleDB、HadoopDB等,下面简单介绍几个

(1)Cassandra:Cassandra是一个列存储数据库,支持跨数据中心的数据复制。它的数据模型提供列索引,log-structured修改,支持反规范化,实体化视图和嵌入超高速缓存。

(2)HBase:Apache Hbase源于Google的Bigtable,是一个开源、分布式、面向列存储的模型。在Hadoop和HDFS之上提供了像Bigtable一样的功能。

(3)Amazon SimpleDB:Amazon SimpleDB是一个非关系型数据存储,它卸下数据库管理的工作。开发者使用Web服务请求存储和查询数据项

(4)Apache Accumulo:Apache Accumulo的有序的、分布式键值数据存储,基于Google的BigTable设计,建立在Apache Hadoop、Zookeeper和Thrift技术之上。

(5)Hypertable:Hypertable是一个开源、可扩展的数据库,模仿Bigtable,支持分片。

(6)Azure Tables:Windows Azure Table Storage Service为要求大量非结构化数据存储的应用提供NoSQL性能。表能够自动扩展到TB级别,能通过REST和Managed API访问。

2、键值数据库:Redis、SimpleDB、Scalaris、Memcached等,下面简单介绍几个

(1)Riak:Riak是一个开源,分布式键值数据库,支持数据复制和容错。(2)Redis:Redis是一个开源的键值存储。支持主从式复制、事务,Pub/Sub、Lua脚本,还支持给Key添加时限。

(3)Dynamo:Dynamo是一个键值分布式数据存储。它直接由亚马逊Dynamo数据库实现;在亚马逊S3产品中使用。

(4)Oracle NoSQL Database:来自Oracle的键值NoSQL数据库。它支持事务ACID(原子性、一致性、持久性和独立性)和JSON。

(5)Oracle NoSQL Database:具备数据备份和分布式键值存储系统。

(6)Voldemort:具备数据备份和分布式键值存储系统。

(7)Aerospike:Aerospike数据库是一个键值存储,支持混合内存架构,通过强一致性和可调一致性保证数据的完整性。

3、文档数据库:MongoDB、CouchDB、Perservere、Terrastore、RavenDB等,下面简单介绍几个

(1)MongoDB:开源、面向文档,也是当下最人气的NoSQL数据库。

(2)CounchDB:Apache CounchDB是一个使用JSON的文档数据库,使用Javascript做MapRece查询,以及一个使用HTTP的API。

(3)Couchbase:NoSQL文档数据库基于JSON模型。

(4)RavenDB:RavenDB是一个基于.NET语言的面向文档数据库。

(5)MarkLogic:MarkLogic NoSQL数据库用来存储基于XML和以文档为中心的信息,支持灵活的模式。

4、图数据库:Neo4J、InfoGrid、OrientDB、GraphDB,下面简单介绍几个

(1)Neo4j:Neo4j是一个图数据库;支持ACID事务(原子性、独立性、持久性和一致性)。

(2)InfiniteGraph:一个图数据库用来维持和遍历对象间的关系,支持分布式数据存储。

(3)AllegroGraph:AllegroGraph是结合使用了内存和磁盘,提供了高可扩展性,支持SPARQ、RDFS++和Prolog推理。

5、内存数据网格:Hazelcast、Oracle Coherence、Terracotta BigMemorry、GemFire、Infinispan、GridGain、GigaSpaces,下面简单介绍几个

(1)Hazelcast:Hazelcast CE是一个开源数据分布平台,它允许开发者在数据库集群之上共享和分割数据。

(2)Oracle Coherence:Oracle的内存数据网格解决方案提供了常用数据的快速访问能力,一致性支持事务处理能力和数据的动态划分。

(3)Terracotta BigMemory:来自Terracotta的分布式内存管理解决方案。这项产品包括一个Ehcache界面、Terracotta管理控制台和BigMemory-Hadoop连接器。

(4)GemFire:Vmware vFabric GemFire是一个分布式数据管理平台,也是一个分布式的数据网格平台,支持内存数据管理、复制、划分、数据识别路由和连续查询。

(5)Infinispan:Infinispan是一个基于Java的开源键值NoSQL数据存储,和分布式数据节点平台,支持事务,peer-to-peer 及client/server 架构。

(6)GridGain:分布式、面向对象、基于内存、SQL+NoSQL键值数据库。支持ACID事务。

(7)GigaSpaces:GigaSpaces内存数据网格能够充当应用的记录系统,并支持各种各样的高速缓存场景。

F. 大数据数据库有哪些

分享10个超好用的数据库:
1、CouchDB
CouchDB是一款完全拥抱互联网的数据库,它将数据存储在文档中,这种文档可以通过Web浏览器来查询,并且用JavaScript来处理。它易于使用,在分布式上网络上具有高可用性和高扩展性。支持的操作系统:Windows、Linux、OS X和安卓。
2、Blazegraph
Blazegraph是一种高度扩展、高性能的数据库。它既有使用开源许可证的版本,也有使用商业许可证的版本。
3、Cassandra
Cassandra数据库最初由Facebook开发,现已被1500多家企业组织使用,它能支持超大规模集群;比如 说,苹果部署的Cassandra系统就包括75000多个节点,拥有的数据量超过10 PB。
4、FlockDB
FlockDB是一种非常快、扩展性非常好的图形数据库,擅长存储社交网络数据。虽然这个项目的开源版已有一段时间没有更新了,但它仍可用于下载。
5、Neo4j
Neo4j是速度快、扩展性佳的原生图形数据库,它具有大规模扩展性、快速的密码查询性能和经过改进的开发效率。支持的操作系统:Windows和Linux。
6、Pivotal Greenplum Database
Greenplum是同类中不错的企业级分析数据库,能够非常快速地对庞大的海量数据进行功能强大的分析。它是Pivotal大数据库套件的一部分。支持的操作系统:Windows、Linux和OS X。
7、Impala
Cloudera基于SQL的Impala数据库是面向Apache Hadoop的开源分析数据库。它可以作为一款独立产品来下载,又是Cloudera的商业大数据产品的一部分。支持的操作系统:Linux和OS X。
8、InfoBright社区版
InfoBright为数据分析而设计,这是一种面向列的数据库,具有很高的压缩比。InfoBright.com提供基于同一代码的收费产品,提供支持服务。支持的操作系统:Windows和Linux。
9、Hibari
这个基于Erlang的项目是一种分布式有序键值存储系统,有很强的一致性。它最初是由Gemini Mobile Technologies开发的,现在已被欧洲和亚洲的几家电信运营商所使用。支持的操作系统:与操作系统无关。
10、MongoDB
mongoDB的下载量已超过1000万人次,是一款极其受欢迎的NoSQL数据库。MongoDB.com上提供了企业版、支持、培训及相关产品和服务。支持的操作系统:Windows、Linux、OS X和Solaris。