Het spijt me dat u de resultaten niet kunt reproduceren. Echter, op een MacBook Air (1,8 GHz i7, 4 GB RAM) met een 2 GB-heap, GCR-cache, maar geen opwarming van de caches en geen andere afstemming, met een dataset van vergelijkbare grootte (1 miljoen gebruikers, 50 vrienden per persoon) , krijg ik herhaaldelijk ongeveer 900 ms met het Traversal Framework op 1.9.2:
public class FriendOfAFriendDepth4
{
private static final TraversalDescription traversalDescription =
Traversal.description()
.depthFirst()
.uniqueness( Uniqueness.NODE_GLOBAL )
.relationships( withName( "FRIEND" ), Direction.OUTGOING )
.evaluator( new Evaluator()
{
@Override
public Evaluation evaluate( Path path )
{
if ( path.length() >= 4 )
{
return Evaluation.INCLUDE_AND_PRUNE;
}
return Evaluation.EXCLUDE_AND_CONTINUE;
}
} );
private final Index<Node> userIndex;
public FriendOfAFriendDepth4( GraphDatabaseService db )
{
this.userIndex = db.index().forNodes( "user" );
}
public Iterator<Path> getFriends( String name )
{
return traversalDescription.traverse(
userIndex.get( "name", name ).getSingle() )
.iterator();
}
public int countFriends( String name )
{
return count( traversalDescription.traverse(
userIndex.get( "name", name ).getSingle() )
.nodes().iterator() );
}
}
Cypher is langzamer, maar lang niet zo langzaam als u suggereert:ongeveer 3 seconden:
START person=node:user(name={name})
MATCH (person)-[:FRIEND]->()-[:FRIEND]->()-[:FRIEND]->()-[:FRIEND]->(friend)
RETURN count(friend)
Met vriendelijke groeten
ian