前言

在前面的文章中，我们已经介绍了Neo4j的基础概念、技术特性和应用场景。本文将提供一个实用的上手教程，帮助开发者和学生快速入门Neo4j，从安装配置到创建第一个图数据库，再到编写Cypher查询语句，一步步引导你掌握图数据库的基本操作。

安装Neo4j

本地安装

Neo4j提供了多种安装方式，适合不同的操作系统和需求。

系统要求

组件	最低要求	推荐配置
操作系统	Windows 10、macOS 10.14+、Ubuntu 18.04+	最新版本
内存	2GB	8GB+
CPU	2核	4核+
存储	10GB空闲空间	SSD，50GB+
Java	OpenJDK 11	OpenJDK 11

安装步骤

flowchart TD
    A[下载Neo4j] --> B{选择版本}
    B -->|社区版| C[下载Community Edition]
    B -->|企业版| D[下载Enterprise Edition]
    C --> E[安装Neo4j]
    D --> E
    E --> F[启动Neo4j服务]
    F --> G[访问Neo4j Browser]

Windows安装

访问Neo4j下载页面
下载Neo4j Desktop应用
运行安装程序，按照向导完成安装
启动Neo4j Desktop，创建新的数据库实例

1 2	# 或使用PowerShell以管理员身份安装 choco install neo4j-community

macOS安装

使用Homebrew安装

# 安装Homebrew（如果尚未安装）
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

# 安装Neo4j
brew install neo4j

# 启动服务
brew services start neo4j

或下载Neo4j Desktop应用程序并安装

Linux安装

# Debian/Ubuntu
wget -O - https://debian.neo4j.com/neotechnology.gpg.key | sudo apt-key add -
echo 'deb https://debian.neo4j.com stable latest' | sudo tee /etc/apt/sources.list.d/neo4j.list
sudo apt-get update
sudo apt-get install neo4j

# 启动服务
sudo systemctl start neo4j

使用Neo4j Sandbox

如果你不想在本地安装，Neo4j提供了云端Sandbox环境，可以免费使用，无需安装。

Neo4j Sandbox

Sandbox使用步骤

访问Neo4j Sandbox
使用邮箱注册/登录
选择一个预设的数据集（电影、推荐系统等）或空白项目
点击”Create”创建Sandbox实例
使用提供的凭据连接到Neo4j Browser
Sandbox实例默认有效期为3天，可以延期到10天

创建第一个图数据库

使用Neo4j Desktop创建数据库

打开Neo4j Desktop
点击”+ Add”按钮
选择”Create a Local Graph”
输入数据库名称（如”MyFirstGraphDB”）
设置密码
选择Neo4j版本
点击”Create”创建数据库
点击”Start”启动数据库
点击”Open”打开Neo4j Browser

初始配置

Neo4j配置文件位于不同位置，取决于安装方式：

Neo4j Desktop: 通过图形界面的Settings选项卡配置
服务器安装: /etc/neo4j/neo4j.conf（Linux）或neo4j-home/conf/neo4j.conf（Windows）

常用配置项：

# 内存配置
dbms.memory.heap.initial_size=512m
dbms.memory.heap.max_size=2G
dbms.memory.pagecache.size=512m

# 连接配置
dbms.connectors.default_listen_address=0.0.0.0
dbms.connector.bolt.listen_address=:7687
dbms.connector.http.listen_address=:7474

图数据建模基础

设计第一个图模型

让我们设计一个简单的电影数据库，包含演员、导演和电影之间的关系。

电影数据库

创建节点和关系

打开Neo4j Browser，输入以下Cypher查询语句创建图数据模型：

// 创建电影节点
CREATE (matrix:Movie {title: 'The Matrix', released: 1999, tagline: 'Welcome to the Real World'})
CREATE (speed:Movie {title: 'Speed', released: 1994, tagline: 'Get ready for rush hour'})

// 创建人物节点
CREATE (keanu:Person {name: 'Keanu Reeves', born: 1964})
CREATE (laurence:Person {name: 'Laurence Fishburne', born: 1961})
CREATE (lana:Person {name: 'Lana Wachowski', born: 1965})

// 创建关系
CREATE (keanu)-[:ACTED_IN {role: 'Neo'}]->(matrix)
CREATE (keanu)-[:ACTED_IN {role: 'Jack Traven'}]->(speed)
CREATE (laurence)-[:ACTED_IN {role: 'Morpheus'}]->(matrix)
CREATE (lana)-[:DIRECTED]->(matrix)

基本Cypher查询

查询语法结构

graph LR
    A[MATCH 指定图模式] --> B[WHERE 筛选条件]
    B --> C[RETURN 返回结果]
    C --> D[ORDER BY 排序]
    D --> E[LIMIT 限制条数]

常用查询示例

1. 查找所有电影

1 2	MATCH (m:Movie) RETURN m.title, m.released

2. 查找特定演员出演的电影

1 2	MATCH (p:Person {name: 'Keanu Reeves'})-[r:ACTED_IN]->(m:Movie) RETURN m.title, r.role

3. 查找电影的导演和演员

1 2	MATCH (d:Person)-[:DIRECTED]->(m:Movie)<-[:ACTED_IN]-(a:Person) RETURN d.name AS Director, m.title AS Movie, collect(a.name) AS Actors

4. 查找两个演员共同出演的电影

1
2
3

MATCH (a1:Person {name: 'Keanu Reeves'})-[:ACTED_IN]->(m:Movie)<-[:ACTED_IN]-(a2:Person)
WHERE a1 <> a2
RETURN a1.name, a2.name, m.title

修改和删除数据

添加新节点和关系

// 添加新电影
CREATE (speed2:Movie {title: 'Speed 2: Cruise Control', released: 1997})

// 添加新演员
CREATE (sandra:Person {name: 'Sandra Bullock', born: 1964})

// 创建关系
MATCH (p:Person), (m:Movie)
WHERE p.name = 'Sandra Bullock' AND m.title IN ['Speed', 'Speed 2: Cruise Control']
CREATE (p)-[:ACTED_IN {role: CASE m.title 
                              WHEN 'Speed' THEN 'Annie Porter'
                              WHEN 'Speed 2: Cruise Control' THEN 'Annie Porter'
                              END}]->(m)

更新属性

// 更新电影属性
MATCH (m:Movie {title: 'The Matrix'})
SET m.tagline = 'Free your mind'
RETURN m.title, m.tagline

删除节点和关系

// 删除关系
MATCH (p:Person {name: 'Keanu Reeves'})-[r:ACTED_IN]->(m:Movie {title: 'Speed 2: Cruise Control'})
DELETE r

// 删除节点（需先删除关联关系）
MATCH (m:Movie {title: 'Speed 2: Cruise Control'})
DETACH DELETE m

数据导入与导出

导入CSV数据

1
2
3

// 从CSV导入电影数据
LOAD CSV WITH HEADERS FROM 'file:///movies.csv' AS row
CREATE (:Movie {id: toInteger(row.movieId), title: row.title, year: toInteger(row.year)})

CSV文件示例（movies.csv）：

movieId,title,year
1,The Shawshank Redemption,1994
2,The Godfather,1972
3,The Dark Knight,2008

使用neo4j-admin工具导入大数据集

对于大型数据集，可以使用neo4j-admin工具进行批量导入：

# 停止Neo4j服务
systemctl stop neo4j

# 使用neo4j-admin import工具
neo4j-admin import --nodes=movies.csv --nodes=actors.csv --relationships=acted_in.csv

# 重启Neo4j服务
systemctl start neo4j

数据导出

# 导出整个数据库
neo4j-admin dump --database=neo4j --to=/backup/neo4j-backup.dump

# 使用Cypher导出结果为CSV
MATCH (m:Movie)
RETURN m.title, m.released
ORDER BY m.released DESC
LIMIT 100

高级功能与最佳实践

使用索引优化查询性能

// 创建索引
CREATE INDEX movie_title FOR (m:Movie) ON (m.title)

// 创建复合索引
CREATE INDEX person_name_born FOR (p:Person) ON (p.name, p.born)

// 查看索引
SHOW INDEXES

// 删除索引
DROP INDEX movie_title

事务处理

// 开始事务
BEGIN

// 执行多个操作
CREATE (m:Movie {title: 'The Matrix 4', released: 2021})
MATCH (p:Person {name: 'Keanu Reeves'})
MATCH (m:Movie {title: 'The Matrix 4'})
CREATE (p)-[:ACTED_IN {role: 'Neo'}]->(m)

// 提交事务
COMMIT
// 或回滚事务
// ROLLBACK

常见性能优化技巧

使用参数化查询：防止Cypher查询缓存失效

// 不好的做法
MATCH (p:Person {name: 'Keanu Reeves'}) RETURN p

// 好的做法 - 使用参数
MATCH (p:Person {name: $name}) RETURN p
// 参数: {name: 'Keanu Reeves'}

避免大型结果集：使用LIMIT限制结果数量

1 2	// 限制结果数量 MATCH (m:Movie) RETURN m LIMIT 10

使用EXPLAIN和PROFILE分析查询

// 查看查询计划
EXPLAIN MATCH (p:Person)-[:ACTED_IN]->(m:Movie) RETURN p.name, m.title

// 执行并分析查询
PROFILE MATCH (p:Person)-[:ACTED_IN]->(m:Movie) RETURN p.name, m.title

常见问题解答

连接问题

graph TD
    A[连接失败] --> B{检查Neo4j服务}
    B -->|未启动| C[启动服务]
    B -->|已启动| D{检查连接配置}
    D -->|配置错误| E[修改neo4j.conf]
    D -->|配置正确| F{检查防火墙}
    F -->|阻止连接| G[开放端口7474和7687]

常见连接问题解决方案：

确保Neo4j服务已启动
检查用户名和密码是否正确
确认连接URL格式（bolt://localhost:7687）
检查防火墙是否阻止连接
验证neo4j.conf中的连接配置

内存问题

如果Neo4j运行缓慢或崩溃，可能是内存配置不足：

增加堆内存和页面缓存大小（neo4j.conf）
监控GC活动和内存使用情况
考虑使用更强大的硬件

查询超时

对于复杂查询：

设置更长的超时时间

1	:config dbms.transaction.timeout=60s

优化查询，使用WHERE子句提前过滤结果
确保使用了合适的索引
考虑分批处理大量数据

与其他编程语言集成

Java示例

// 添加依赖
// <dependency>
//     <groupId>org.neo4j.driver</groupId>
//     <artifactId>neo4j-java-driver</artifactId>
//     <version>4.4.0</version>
// </dependency>

import org.neo4j.driver.*;

public class Neo4jExample {
    public static void main(String[] args) {
        // 创建Neo4j驱动实例
        Driver driver = GraphDatabase.driver("bolt://localhost:7687", 
                              AuthTokens.basic("neo4j", "password"));
                              
        // 创建会话
        try (Session session = driver.session()) {
            // 执行查询
            Result result = session.run("MATCH (m:Movie) RETURN m.title, m.released ORDER BY m.released DESC LIMIT 5");
            
            // 处理结果
            while (result.hasNext()) {
                Record record = result.next();
                System.out.println(record.get("m.title").asString() + " (" + 
                                  record.get("m.released").asInt() + ")");
            }
        }
        
        // 关闭驱动
        driver.close();
    }
}

Python示例

# 安装依赖
# pip install neo4j

from neo4j import GraphDatabase

# 创建Neo4j驱动实例
driver = GraphDatabase.driver("bolt://localhost:7687", 
                             auth=("neo4j", "password"))

# 定义查询函数
def get_movies(tx):
    result = tx.run("MATCH (m:Movie) RETURN m.title, m.released ORDER BY m.released DESC LIMIT 5")
    return [{"title": record["m.title"], "released": record["m.released"]} 
            for record in result]

# 创建会话并执行查询
with driver.session() as session:
    movies = session.read_transaction(get_movies)
    for movie in movies:
        print(f"{movie['title']} ({movie['released']})")

# 关闭驱动
driver.close()

JavaScript示例

// 安装依赖
// npm install neo4j-driver

const neo4j = require('neo4j-driver');

// 创建Neo4j驱动实例
const driver = neo4j.driver('bolt://localhost:7687', 
                          neo4j.auth.basic('neo4j', 'password'));

// 创建会话
const session = driver.session();

// 执行查询
session.run('MATCH (m:Movie) RETURN m.title, m.released ORDER BY m.released DESC LIMIT 5')
  .then(result => {
    result.records.forEach(record => {
      console.log(`${record.get('m.title')} (${record.get('m.released')})`);
    });
  })
  .catch(error => {
    console.error('查询出错:', error);
  })
  .finally(() => {
    // 关闭会话和驱动
    session.close();
    driver.close();
  });

总结

本文提供了Neo4j的基本安装和使用教程，从环境搭建到创建图数据库，再到编写Cypher查询和集成应用程序。通过这些基础知识，你已经具备了使用Neo4j开发图数据应用的能力。图数据库为处理关联数据提供了强大而直观的工具，希望这篇教程能帮助你在实际项目中充分发挥Neo4j的潜力。